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Chapitre 1 


Introduction 


Ce cours est un cours sur les fondements de l’informatique : il se focalise sur trois 
domaines centraux en informatique : la logique, les modèles de calculs et la complexité. 

Tous ces domaines sont reliés par la question suivante : quelles sont les capacités 
et les limites des ordinateurs ? 

Même un téléphone est maintenant capable de résoudre très rapidement certains 
problèmes, comme trier un répertoire de plus d’un million d’entrées. Par contre, cer- 
tains problèmes s’avèrent beaucoup plus lents et difficiles à résoudre : par exemple, ré- 
soudre un problème d’emploi du temps, ou affecter les choix d’affectations des élèves 
de l’école polytechnique en fonction de leurs préférences ordonnées. 

Au cœur de ce cours est la compréhension de ce qui fait qu’un problème, comme le 
tri, est simple à résoudre informatiquement, alors qu’un problème comme un problème 
d’emploi du temps, peut prendre des siècles à résoudre avec seulement un millier de 
données en entrée. 

Autrement dit, au cœur de nos interrogations est aussi la question suivante : qu’est- 
ce qui rend certains problèmes difficiles, et d’autres faciles ? 

C’est la question centrale de la théorie de la complexité, et de la calculabilité. 

Pourquoi s’intéresser à comprendre les problèmes difficiles, plutôt que d’essayer 
de résoudre des problèmes très concrets ? 

Premièrement, parce que des problèmes très simples et concrets, et aux enjeux 
économiques considérables, s’avèrent faire partie des problèmes difficiles. 

Deuxièmement, parce que comprendre qu’un problème ne peut pas être résolu fa- 
cilement est utile. Cela signifie que le problème doit être simplifié ou modifié pour 
pouvoir être résolu. Ce cours permet réellement de comprendre les pistes pour éviter 
les problèmes difficiles à résoudre informatiquement. 

Enfin et surtout parce que les problèmes difficiles ont réellement des implications 
dans la conception de nombreux systèmes actuels. Par exemple, pour la vérification, 
l’analyse, et la conception de systèmes : lorsqu’on conçoit un système, on souhaite en 
général qu’il se comporte au minimum selon la spécification avec laquelle on l’a conçu. 
On aimerait que le processus de vérification puisse s’automatiser, c’est-à-dire que l’on 
puisse garantir informatiquement qu’un système donné vérifie une/sa spécification. 
Surtout, lorsque le système en question est d’une complexité énorme, comme les pro- 
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cesseurs actuels, et qu’un unique être humain n’est plus capable d’en comprendre seul 
tous les composants. 

Les résultats de ce cours montrent précisément que le processus de vérification ne 
peut pas s’automatiser facilement. Tout l’art de la vérification de systèmes, et donc de 
la conception de systèmes, est de tenter d’éviter ces difficultés pour la rendre praticable, 
ce qui nécessite d’avoir compris ces difficultés. 

D’autres domaines sont fortement impactés par la complexité. Un des premiers qui 
l’a été historiquement est la cryptographie : dans la plupart des domaines, on cherche 
plutôt à privilégier les problèmes faciles à résoudre aux problèmes difficiles. La crypto- 
graphie est originale de ce point de vue, car elle recherche plutôt les problèmes difficiles 
à résoudre que les problèmes simples, car un code secret doit être dur à casser sans la 
clé secrète. 

On peut aussi se demander : pourquoi autant de logique dans un cours sur les fon- 
dements de l’informatique ? 

Une première raison est parce que les programmes informatiques et les langages 
informatiques sont essentiellement basés sur la logique. Les processeurs sont d’ailleurs 
essentiellement composés de portes logiques. Les programmes sont essentiellement 
faits d’instructions logiques, et de tests logiques. Comprendre cette logique permet de 
bien comprendre ce que font les programmes informatiques. 

De façon plus fondamentale, les programmes et les systèmes informatiques obligent 
bien souvent à décrire très précisément les objets sur lesquels ils travaillent : pour 
résoudre un problème d’emploi du temps, le système va obliger à décrire toutes les 
contraintes. Pour faire une requête sur une base de données, le système va obliger à 
formuler très précisément cette requête. Il s’avère que la logique mathématique est un 
outil très naturel pour décrire le monde qui nous entoure, et à vrai dire, le modèle le 
plus naturel que nous connaissons pour le faire. Comprendre les concepts de la logique, 
permet de bien comprendre nombre de concepts informatiques. Par exemple, pour dé- 
crire le système d’information d’une entreprise, ou tout système complexe, le meilleur 
outil reste bien souvent la logique mathématique. 

Une troisième raison est historique, et au cœur en fait de la naissance de l’infor- 
matique. Durant la première moitié du siècle dernier, des mathématiciens comme Kurt 
Güdel, Alonzo Church ou Alan Turing ont découvert que certains problèmes ne pou- 
vaient pas se résoudre par des dispositifs informatiques ou automatiques comme les 
ordinateurs. Par exemple, le problème de déterminer si un énoncé mathématique est 
vrai ou non. Cette tâche, qui est le quotidien du mathématicien, ne peut pas être résolue 
par aucun ordinateur, quelle que soit sa puissance. 

Les conséquences de ces résultats profonds ont permis la naissance d’idées sur des 
modèles d’ordinateurs qui ont mené à la conception des ordinateurs actuels. 

Au cœur de ces découvertes sont des liens très forts qui unissent algorithmes et dé- 
monstrations : une démonstration logique correspond à un algorithme. A partir d’hypo- 
thèses, on déduit des nouvelles assertions à l’aide de règles logiques. Réciproquement, 
un programme correspond à une démonstration dans un certain sens. 

Ce sont ces liens forts entre algorithmes et démonstrations qui ont fait naître l’infor- 
matique et ses concepts et ce bien avant l’existence même de machines aussi puissantes 
que celles que nous connaissons actuellement. Historiquement, la première question 
était : “qu'est-ce qu’une démonstration” ? Elle est maintenant devenue : “qu'est-ce 
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qu’un ordinateur” ? 

Ils ont par ailleurs révolutionné notre conception des mathématiques, de l’informa- 
tique, et plus généralement du monde qui nous entoure. 

En mathématiques, ces liens ont mené à une crise des fondements, avec le retour sur 
des questions aussi fondamentales que celle-ci : qu’est-ce qu’un ensemble, qu’est-ce 
qu’une démonstration ? Que peut-on prouver ? 

L’ambition de ce document est plutôt de se focaliser sur l’informatique. Nous es- 
timerons que ce cours aura atteint son but si notre lecteur change au final la réponse 
qu'il aurait pu faire à priori sur des questions aussi simples que celle-ci : 

— qu'est-ce qu’un ordinateur ? 

— qu'est-ce qu’une preuve ? 

— qu'est-ce qu’un algorithme ? 
qu'est-ce qu’un bon algorithme ? 

Si tel est le cas, sa façon de programmer, ou d’appréhender un problème informa- 
tique ne devrait plus être la même. 


Remerciements L'auteur de ce document souhaite remercier vivement Johanne Co- 
hen, Bruno Salvy et David Monniaux pour leurs retours sur des versions préliminaires 
de ce document. Je remercie par ailleurs les promotions 2011-2012, 2012-2013 pour 
leurs retours. Des remerciements particuliers à Carlo Ferrari, Stéphane Lengrand et Ar- 
naud Lenoir pour des retours détaillés et des suggestions précises d'améliorations sur 
les versions antérieures de ce polycopié. 

Tous les commentaires (mêmes typographiques, orthographiques, etc.) sur ce do- 
cument sont les bienvenus et à adresser à bournez@lix.polytechnique.fr. 


Sur les exercices Certains des exercices sont corrigés. Les corrections se trouvent 
en fin du polycopié dans un chapitre consacré à des solutions. Les exercices marqués 
d’une étoile nécessitent plus de réflexions. 


1.1 Concepts mathématiques 


1.1.1 Ensembles, Fonctions 


Soit E un ensemble, et e un élément. On note e€E pour signifier que e est un 
élément de l’ensemble E. Si À et B sont deux ensembles, on note À C B pour signifier 
que tout élément de À est un élément de B. On dit dans ce cas que À est une partie 
de B. Lorsque Æ est un ensemble, les parties de Æ constituent un ensemble que l’on 
note P(E). On notera AU B, AN B pour respectivement l’union et l’intersection des 
ensembles À et B. Lorsque À est une partie de F, on notera A° pour le complémentaire 
de À dans E. 


Exercice 1.1. Soient À, B deux partie de E. Prouver les lois de Morgan : (AUB)° = 
AnNnBe(AnBy = AUB°. 


Exercice 1.2. Soient À, B,C trois partie de E. Prouver que AN (BU C) = (AN 
B)U(ANC)e AU(BNC) = (AUB)N (AUC). 
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Exercice 1.3. Soient À, B,C trois partie de E. Montrer que AN B° = ANC® siet 
seulement si AN B = ANC. 


On appelle produit cartésien, de deux ensembles E et F, noté E x F, l’ensemble 
des couples formés d’un élément de Æ et d’un élément de F': 


ExXF={{x,yxeEeyeF}. 


Pour n > 1 un entier, on note E" = E x... x E le produit cartésien de E par lui 
même n fois. £” peut aussi se définir] Jrécursivement par Et =E,etEnti = EXE", 

Intuitivement, une application f d’un ensemble Æ vers un ensemble Fest un ob- 
jet qui associe à chaque élément e d’un ensemble Æ un unique élément f(e) de F. 
Formellement, une fonction f d’un ensemble Æ vers un ensemble F est une partie l° 
de E x F. Son domaine est l’ensemble des x € E tel que (x,y) € T pour un cer- 
tain y € E. Son image est l’ensemble des y € F tel que (x,y) € T pour un certain 
x € E. Une application f d’un ensemble E vers un ensemble F est une fonction dont 
le domaine est E. 

Une famille (x;);e71 d'éléments d’un ensemble X est une application d’un ensemble 
T dans X. J est appelé l’ensemble des indices, et l’image par cette application de l’élé- 
ment à € I est notée r;. 

Le produit cartésien se généralise à une famille d’ensembles : 


Fixe x En = f(issssmn)lmi € En: > Tn € En}. 


L'union et l’intersection se généralisent à une famille quelconque de parties d’un 
ensemble Æ. Soit (A;);-7 une famille de parties de E. 


[UAi={eeElieree A}; 
icl 


NA ={teEMelee A}. 


icl 


Exercice 1.4. Soit À une partie de E, et (B;);er une famille de parties de E. Prouver 
les deux égalités suivantes 


sU(N2) -Quurs 


4€ icl 
aN(Uz) -Uunso 
icl icl 


On notera N l’ensemble des entiers naturels, Z l’ensemble des entiers relatifs, R 
l’ensemble des réels, et C l’ensemble des complexes. Z est un anneau. R et C sont des 
corps. On notera R°?° l’ensemble des réels positifs ou nuls. 


1. Il y a une bijection entre les objets définis par les deux définitions. 
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1.1.2 Alphabets, Mots, Langages 


Nous rappelons maintenant quelques définitions élémentaires sur les mots et les 
langages. La terminologie, empruntée à la linguistique, rappelle que les premiers tra- 
vaux sur les concepts de langages formels sont issus de la modélisation de la langue 
naturelle. 

On fixe un ensemble fini © que l’on appelle alphabet. Les éléments de X sont 
appelés des lettres ou des symboles. 


Exemple 1.1 — Eyin = {0,1} est l’alphabet binaire. 

— Xyatin = {A,B,C,D,...,Z,a,b,c,d,...,2} est l'alphabet correspondant aux 
lettres de l’alphabet latin. 

— Enombre = {0,1,2,--- ,9} est l'alphabet correspondant aux chiffres en base 
10. 

— L'ensemble des caractères ASCII, ou l’ensemble des caractères imprimables, est 
un alphabet, que l’on peut noté YAscrr. 

— exp = 40,1,2,---,9,+,—,*,/,(,)}, où +, —, x, /, ( ) désignent des sym- 
boles particuliers, est l'alphabet des expressions arithmétiques. 


Un mot w sur l’alphabet Y est une suite finie w1w2 : - : w, de lettres de Y. L’entier 
n est appelé la longueur du mot w. Il est noté |w!|. 


Exemple 1.2 — 10011 est un mot sur l'alphabet Y3,;, de longueur 5. 
— 9120 est un mot sur l'alphabet ombre; Mais n’est pas un mot sur l’alphabet 
Ebin- 


— Bonjour est un mot de longueur 6 sur l’alphabet Yiatin ; azrddfb est aussi 
un mot de longueur 7 sur ce même alphabet. Elève n’est pas un mot sur cet 
alphabet, car le symbole à (e accent grave) n’est pas dans l’alphabet Yiotin 
défini plus haut. 

— Éléphant et z’!\\” sont des mots sur l'alphabet E Ascrr. 

243+(5*(1+6)) est un mot sur l’alphabet Xexp. 

24*((((5/+)//+ est aussi mot sur l'alphabet Dexp. 


Un langage sur Y est un ensemble de mots sur X. L'ensemble de tous les mots sur 
l'alphabet Y est noté X*. Le mot vide € est le seul mot de longueur 0. Le mot vide 
n’est rien d’autre qu’un mot particulier : il est possible qu’un langage contienne le mot 
vide (qui est un mot particulier), ou qu’un langage ne contienne pas le mot vide. >* 
contient toujours par définition le mot vide. 


Exemple 1.3 — {0,1}* désigne l’ensemble des mots sur l'alphabet Erin = {0,1}. 
Par exemple, 00001101 € {0,1}. On a aussi e € {0,1}*. 
— {bonjour, aurevoir} est un langage sur Xiuin. Ce langage contient deux mots. 
— L'ensemble des mots du dictionnaire du français écrits sans caractères accentués 
est un langage sur l’alphabet Eiatin. 
— L'ensemble des mots du dictionnaire du français est un langage sur l’alphabet 


Ascrr. 
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— L'ensemble des phrases de ce document est un langage sur l’alphabet des ca- 
ractères ASCII. On observera que le caractère , c’est-à-dire le caractère espace 
blanc, utilisé pour séparer les mots dans une phrase, est un caractère ASCII 
particulier. 

— Xexp contient des mots comme 24*{((((5/+)/+ qui ne correspondent à aucune 
expression arithmétique valide. L'ensemble des mots correspondant à une ex- 
pression arithmétique valide, comme 5+(2*(1-3)*#3), est un langage particulier 
sur exp 


On définit une opération de concaténation sur les mots : la concaténation du mot 
U = UjU2 : : - Un et du mot v = vi: : : - VA, est le mot noté u.v défini par uU2 : : : Un V1 V2 : * : Um, 
c’est-à-dire le mot dont les lettres sont obtenues en juxtaposant les lettres de v à la 
fin de celles de u. L'opération de concaténation notée . est associative, mais non- 
commutative. Le mot vide est un élément neutre à droite et à gauche de cette opération. 
On appelle aussi Z* le monoïde (libre) sur l’alphabet Y (car l’opération de concaténa- 
tion lui donne une structure de monoïde)|? 
On note aussi uv pour la concaténation u.v. En fait, tout mot wiw2 - - - w, peut se 
voir comme w1.W2 : -: .Wn, Où w; représente le mot de longueur 1 réduit à la lettre w;. 
Cette confusion entre les lettres et les mots de longueur 1 est souvent très pratique. 


Exemple 1.4 Si Y est l’ensemble {a, b}, alors aaab est le mot de longueur À dont les 
trois premières lettres sont a, et la dernière est b. C’est aussi la concaténation des 
quatre mots de longueur un : a, a, a et b. 


Lorsque i est un entier, et w un mot, on écrit w° pour le mot obtenu en concaténant 
i fois le mot w : w° est le mot vide €, w! est le mot w, et w+l est w.w.--- ,w où il y 
a à fois le mot w. Autrement dit, w°+1 = ww = ww’ pour tout entier 4. 


Exemple 1.5 En utilisant la confusion précédente entre lettres et mots de longueur 1, 
aaabbc peut aussi s’écrire a*b?c. 


Un mot u est un préfixe d’un mot w, s’il existe un mot z tel que w = u.z. C’est un 
préfixe propre si u £ w. Un mot u est un suffixe d’un mot w s’il existe un mot z tel que 
W = Z.U. 


1.13 Changement d’alphabet 


Il est souvent utile de pouvoir réécrire un mot sur un alphabet en un mot sur un 
autre alphabet. Par exemple, on a souvent besoin en informatique de coder en binaire, 
c’est-à-dire avec l’alphabet Z = {0,1}. 

Une façon de faire pour changer d’alphabet est de procèder par réécriture lettre par 
lettre. 


Exemple 1.6 Si X est l'alphabet {a, b, c}, et T = {0,1}, alors on peut coder les mots 
de X* sur T* par la fonction h telle que h(a) = O1, h(b) = 10, h(c) = 11. Le mot 


2. Un monoïde est une structure algébrique consistant en un ensemble muni d’une loi de composition 
interne associative et d’un élément neutre. 
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abab se code alors par h(abab) = 01100110, c’est-à-dire par le mot obtenu en codant 
lettre par lettre. 


Très formellement, étant donnés deux alphabets X et [', un homomorphisme est une 
application de X* dans l'* telle que 

— h(e) = € 

— h(u.v) = h(u).h(v) pour tous mots u et v. 

En fait, tout homomorphisme est parfaitement déterminé par son image sur les 
lettres de Y. Il s’étend alors aux mots de X* par 


hk(wiw2 -::w,) = h(w:).h(w2)...…. h(wh) 


pour tout mot w = wiw2::-w, : les plus assidus auront remarqué par la suite que 
c’est en fait une conséquence du théorème[2.5]du chapitre[2?] 


1.1.4 Graphes 


Un graphe G = (V, E) est donné par un ensemble V, dont les éléments sont appe- 
lés sommets, et d’une partie de E € V x V, dont les éléments sont appelés des arcs. 
Dans certains ouvrages, on parle de nœuds comme synonyme de sommet. 

Un chemin de 5 à t est une suite (s = 50,...,8n — t) de sommets tels que, pour 
1<i<n,(s;-1,8) soit un arc. Un chemin simple est un chemin qui ne passe pas 
deux fois par le même sommet. Un circuit est un chemin de longueur non nulle dont 
l’origine coïncide avec l’extrémité. 

Si les arcs ne sont pas orientés, c’est-à-dire, si l’on considère qu’à chaque fois qu’il 
y a l’arc (u, v), alors il y a aussi l’arc (v, u) (et réciproquement), on dit que le graphe 
G est non orienté, et les éléments de Æ sont appelés des arêtes. Lorsqu'il y a une arête 
entre u et v, c’est-à-dire lorsque (u,v) € ÆE, on dit aussi que u et v sont voisins. Le 
degré d’un sommet u est le nombre de ses voisins. 


Exemple 1.7 Le graphe (non-orienté) G = (V, E) avec 
— V ={0,1,...,6} 
== {(0, b) (3,4), (5, 1), (6, 3), (6,4)}. 


est représenté ci-dessous. 


Un graphe est dit connexe si deux quelconques de ses sommets sont reliés par un 
chemin. 


Exemple 1.8 Le graphe de l'exemple[1.7n'est pas connexe, car il n’y a aucun chemin 
entre les sommets 1 et 6. 
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1.1.5 Arbres 


Les arbres sont omniprésents en informatique. En fait, plusieurs notions distinctes 
se cachent sous cette terminologie : arbres libres, arbres enracinés, arbres ordonnés, 
etc. 

Il y a par ailleurs plusieurs façons de présenter les arbres, et ces différentes notions. 
Essentiellement, on peut le faire en partant de la théorie des graphes, ou alors en partant 
de définitions inductives (récursives). 

Puisque nous reviendrons sur les définitions inductives de plusieurs de ces classes 
d’arbres dans le chapitre[?] présentons ici les arbres en utilisant les graphes. 

On va présenter dans ce qui suit des familles d’arbres de plus en plus contraints : 
dans l’ordre, on va présenter les arbres libres, puis les arbres enracinés, les arbres or- 
donnés. 


Arbres libres 


Un arbre libre est un graphe non-orienté connexe et sans circuit. On appelle feuille 
un sommet de l’arbre qui ne possède qu’un seul voisin. Un sommet qui n’est pas une 
feuille est appelé un sommet interne. 


Exemple 1.9 (Un arbre libre) Représentation graphique d’un arbre libre, dont les 
feuilles sont les sommets 5,0 et 6. 


Presque tous nos arbres seront étiquetés : soit À un ensemble dont les éléments sont 
appelés des étiquettes. Un arbre étiqueté par À est la donnée d’un arbre G = (V,E) et 
d’une application qui associe à chaque sommet de V un élément de À. 


Arbre enraciné 
Un arbre enraciné ou arbre est un arbre libre muni d’un sommet distingué, appelé 


sa racine. Soit T'un arbre de racine r. 


Exemple 1.10 (Un arbre) Représentation graphique d’un arbre, dont les feuilles sont 
les sommets 5,0, 4 et 2. On représente la racine 3 en haut. 
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Pour tout sommet x, il existe un chemin simple unique de la racine r à x. Tout 
sommet y sur ce chemin est un ancêtre de x, et x est un descendant de y. Le sous-arbre 
de racine x est l’arbre contenant tous les descendants de x. L’avant-dernier sommet y 
sur l’unique chemin reliant r à x est le parent (ou le père ou la mère) de x, et x est un 
enfant (ou un fils ou une fille) de y. 

L’arité d’un sommet est le nombre de ses enfants. Un sommet sans enfant est une 
feuille, un sommet d’arité strictement positive est appelé sommet interne. La hauteur 
d’un arbre Test la longueur maximale d’un chemin reliant sa racine à une feuille. Un 
arbre réduit à un seul sommet est de hauteur 0. 


Arbres ordonnés 


Un arbre ordonné (on dit aussi arbre plan ) est un arbre dans lequel l’ensemble des 
enfants de chaque sommet est totalement ordonné. Autrement dit, pour chaque sommet 
interne d’arité k, on la notion de lier fils, 2ième fils, ..., kème fils. 

Par exemple, un livre structuré en chapitres, sections, etc se présente comme un 
arbre ordonné. 


Exemple 1.11 (Arbre ordonné de la table des matières d’un livre) 


Le concept d’arbre binaire est assez différent des définitions d’arbre libre, arbre 
enraciné et arbre ordonné. Il est présenté dans la section du chapitre[?] 


Autres notions d’arbre 
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Les termes sont des arbres ordonnés étiquetés particuliers. Ils sont présentés dans 


la section du chapitre[2] 


1.2 La méthode de diagonalisation 


Rappelons que N? = N x N est dénombrable : il est possible de mettre en corres- 
pondance N avec N?. Nous allons illustrer graphiquement une façon de parcourir les 
couples d’entiers. 


Exercice 1.5.  Prouver formellement que N x N est dénombrable en exhibant la 
bijection f : N°? — N de la figure plus haut. 


Produire une autre bijection entre N° et N. 


Par contre, l’ensemble des parties de N n’est pas dénombrable : cela peut se prouver 
par la méthode de diagonalisation dûe à Cantor. 


Illustrons-le graphiquement. Supposons que l’on puisse énumérer les parties de N, 
et notons les T1, 12, ...1 .. .Chaque partie 7; de N peut se voir comme la ligne à du 
tableau M = (M; ,;):;,; à entrées dans {0, 1} dont l’élément M, ; est 1 si et seulement 
si l’élément j est dans la ième partie de N. 
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T; M; 
Ti 
To 
; 
0 1 se se J 


On considère alors la partie T* obtenue en “inversant la diagonale de M” : formel- 
lement, on considère T* = {j|M,; = 0}. Cette partie de N n’est pas dans l’énumé- 
ration, car sinon elle devrait avoir un numéro Jo : si jo € T*, alors on devrait avoir 
M,,59 = 1 par définition de M, et M;, ,;5, = 0 par définition de T* : ce qui est impos- 
sible. Si jo Z T*, alors on devrait avoir M, ;, = 0 par définition de M, et M,,,;, = 1 
par définition de T* : ce qui est impossible. 

Cet argument est à la base de certains raisonnements en calculabilité, comme nous 
le verrons. 


0:30 


Exercice 1.6. Prouver que l’ensemble des suites (un )nen à valeurs dans {0,1} n'est 
pas dénombrable. 


Exercice 1.7. Prouver que R n’est pas dénombrable. 


1.3 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 
nous suggérons la lecture de ou du polycopié du cours 
INF421, ou des polycopiés des cours de l’école polytechnique de première année et 
des cours de classes préparatoires. 


Bibliographie La partie sur les arbres est essentiellement reprise du polycopié de 
INF421. Le reste du chapitre est inspiré de différentes sources dont le polycopié de 


INF561, [Hopcroft et al., 2001] et [Arnold and Guessarian, 2005]. L'introduction est 
essentiellement reprise de |Sipser, 1997]. 


20 


CHAPITRE 1. INTRODUCTION 


Chapitre 2 


Récursivité et induction 


2.1 Motivation 


Les définitions récursives sont omniprésentes en informatique. Elles sont présentes 
à la fois dans les langages de programmation, mais aussi présentes dans de nombreux 
concepts que l’on manipule. 


Exemple 2.1 (Listes en JAVA) En JAVA, avec 


class Liste { 
int contenu; 
Liste suivant; 


} 


Liste st; 


on définit la classe Liste de façon récursive (inductive) : en utilisant dans la définition 
de la classe, le champ “suivant ” du type de la classe Liste elle même. 


Exemple 2.2 (Arbres ordonnés) Nous avons défini les arbres ordonnés dans le cha- 
pitre précédent en passant par la notion de graphe. Une alternative naturelle serait de 
présenter les arbres ordonnés par une définition récursive : un arbre ordonné est soit 
vide, soit réduit à un sommet (une racine), soit constitué d’un sommet (une racine) et 
une liste (ordonnée) d'arbres ordonnés (ses fils). 


Dans ce chapitre, nous nous attardons sur les définitions inductives d’ensembles et 
de fonctions, qui permettent de donner un sens à des définitions récursives. 

Nous discutons, par ailleurs comment il est possible de faire des preuves sur des 
structures définies inductivement, en introduisant les preuves par induction structurelle. 


2.2 Raisonnement par récurrence sur N 


L’induction structurelle est une généralisation de la preuve par récurrence : reve- 
nons sur cette dernière pour avoir les idées au clair. 
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Lorsque l’on raisonne sur les entiers, le premier principe d’induction aussi appelé 
principe de récurrence mathématique est un mode de raisonnement particulièrement 
utile. 


Théorème 2.1 Soit P(n) un prédicat (une propriété) dépendant de l’entier n. Si les 
deux conditions suivantes sont vérifiées : 

(B) P(0) est vrai; 

(1) P(n) implique P(n + 1) pour tout n ; 
alors pour tout entier n, P(n) est vrai. 


Démonstration: Le raisonnement se fait par l’absurde. Considérons X = {k € 
N|P(k) est faux}. Si X est non vide, il admet un plus petit élément n. D’après la 
condition (B), n Z£ 0, et donc n — 1 est un entier, et P(n — 1) est vrai par définition de 
X. On obtient une contradiction avec la propriété (7) appliquée pour l’entier n — 1. 


Pour faire une preuve par récurrence, on établit donc une propriété en 0 (cas de 
base), et on établit que la propriété est héréditaire, où inductive : P(n) implique P(n - 
1) pour tout n. 

Le concept de preuve inductive généralise cette idée à d’autres ensembles que les 
entiers, à savoir aux ensembles qui se définissent inductivement. 


Exercice 2.1. On considère S, — 1%+2%+..:+(2n — 1)*. Prouver par récurrence 


que Sn = 2n* — n?. 


Lau 2, 
2n+1° 


Exercice 2.2. Prouver par récurrence que D }5_; Er r = 
Exercice 2.3. Le théorème plus haut est parfois nommé “premier principe d’induc- 
tion”. Prouver le “second principe d’induction” : soit P(n) une propriété dépendant 
de l’entier n. Si la propriété suivante est vérifiée : si pour tout n € N, si en supposant 
pour tout entier k < n la propriété P(k) on déduit P(n), alors pour tout n € N, la 
propriété P(n) est vraie. 


Exercice 2.4. On fixe un alphabet Y. On rappelle qu’un langage sur Y est une partie 
de X*. Si Li et L2 sont deux langages de Y*, on définit leur concaténation par Li.L2 = 
{u.vlu € L\,v € L2}. La concaténation est une opération associative admettant {e} 
comme élément neutre. On peut alors définir les puissances d’un langage L de la façon 
suivante : L° = {e}, et pour un entier n > 0, LT = LL = L.L", L'étoile d’un 
langage L est défini par L* = {),.\ L?. 

Soient L et M deux langages sur Y, avec € & L. Montrer que dans P(X) (les 
langages sur Y), l'équation X = L.X U M admet pour unique solution le langage 
L*.M. 


2.3 Définitions inductives 


Les définitions inductives visent à définir des parties d’un ensemble E. 
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Remarque 2.1 Cette remarque est pour les puristes. Elle peut être évitée lors de la 
première lecture de ce document. 

Nous nous restreignons dans ce document au cadre où l’on souhaite définir par 
induction des objets qui correspondent à des parties d’un ensemble déjà connu E. 
Nous faisons cela pour éviter les subtilités et paradoxes de la théorie des ensembles. 

Le lecteur très attentif pourra observer que l’on considérera dans la suite très 
souvent l'écriture syntaxique des objets plutôt que les objets eux-mêmes. En effet, en 
faisant ainsi, on garantit que l’on se place sur l’ensemble E = Y* pour un certain 
alphabet Y,, et on évite de se poser la question de l’existence de l’ensemble E sous- 
Jjacent dans les raisonnements qui suivent. 

Par exemple, pour formaliser complètement l ’exemple[2. Tplus haut, on chercherait 
plutôt à définir une représentation syntaxique des listes plutôt que les listes. 


Lorsque l’on veut définir un ensemble, ou une partie d’un ensemble, une façon de 
faire est de le définir de façon explicite, c’est-à-dire en décrivant précisément quels sont 
ses éléments. 


Exemple 2.3 Les entiers pairs peuvent se définir par P = {n|5k ENn=2*+k}. 


Malheureusement, ce n’est pas toujours aussi facile, et il est souvent beaucoup plus 
commode de définir un ensemble par une définition inductive. Un exemple typique de 
définition inductive est une définition comme celle-ci : 


Exemple 2.4 Les entiers pairs correspondent aussi au plus petit ensemble qui contient 
0 et tel que si n est pair, alors n + 2 est pair. 


Remarque 2.2 Observons que l’ensemble des entiers N vérifie bien que 0 est un entier, 
et que si n est un entier n + 2 aussi. Il y a donc besoin de dire que c’est le plus petit 
ensemble avec cette propriété. 


2.3.1 Principe général d’une définition inductive 


Intuitivement, une partie X se définit inductivement si on peut la définir avec la 
donnée explicite de certains éléments de X et de moyens de construire de nouveaux 
éléments de X à partir d'éléments de X. 

De façon générique, dans une définition inductive, 

— certains éléments de l’ensemble X sont donnés explicitement (c’est-à-dire on se 
donne un ensemble B d’éléments de X, qui constitue l’ensemble de base de la 
définition inductive) ; 

— les autres éléments de l’ensemble X sont définis en fonction d’éléments appar- 
tenant déjà à l’ensemble X selon certaines règles (c’est-à-dire on se donne des 
règles R de formation d’éléments, qui constituent les étapes inductives de la dé- 
finition récursive). 

On considère alors le plus petit ensemble qui contient B et qui est stable (on dit 

aussi parfois clos ou fermé) par les règles de A. 


24 CHAPITRE 2. RÉCURSIVITÉ ET INDUCTION 


2.3.2 Formalisation : Premier théorème du point fixe 


Formellement, tout cela se justifie par le théorème qui suit. 


Définition 2.1 (Définition inductive) Soit E un ensemble. Une définition inductive 
d’une partie X de E consiste à se donner 
— un sous ensemble non vide B de E (appelé ensemble de base) 
— et d’un ensemble de règles R : chaque règle r; € R est une fonction (qui peut 
être partielle) r; de E"* — E pour un certain entier n; > 1. 


Théorème 2.2 (Théorème du point fixe) À une définition inductive correspond un plus 
petit ensemble qui vérifie les propriétés suivantes : 


(B) il contient B: BCX; 


(1) il est stable par les règles de R : pour chaque règle r; € R, pour tout x1,:-: ,%n, € 
X,onari(ti1,::,%n,) € À. 


On dit que cet ensemble est alors défini inductivement. 


Démonstration: Soit F l’ensemble des parties de E vérifiant (B) et (7). L’en- 
semble F est non vide car il contient au moins un élément : en effet, l’ensemble E 
vérifie les conditions (B) et (1) et donc E € F. 

On peut alors considérer X défini comme l'intersection de tous les éléments de F. 
Formellement, 

X = N Y. (2.1) 
YEeF 

Puisque B est inclus dans chaque Y € F, B est inclus dans X. Donc X vérifie la 
condition (B). 

L'ensemble obtenu vérifie aussi (7). En effet, considérons une règle r; € R, et des 
T1," ,Tn, € X. On a T1,::: ,%n, € YŸ pour chaque Y € F. Pour chaque tel Y, 
puisque Ÿ est stable par la règle r;, on doit avoir r(x1,--- ,æ»,) € ŸY. Puisque cela est 
vrai pour tout Ÿ € F, on a aussi r(x1,--: ,%,.) € X, ce qui prouve que X est stable 
par la règle r;. 

X est le plus petit ensemble qui vérifie les conditions (B) et (TJ), car il est par 
définition inclus dans tout autre ensemble vérifiant les conditions (B) et (7). 


2.3.3 Différentes notations d’une définition inductive 


Notation 2.1 On note souvent une définition inductive sous la forme 
(B)xex 
avec une ligne comme celle là pour chaque x € B 
(ou éventuellement on écrit BC X ); 
(D) 21, tn, EX = rit, An) EX 
avec une telle ligne pour chaque règle r; € R. 


Exemple 2.5 Selon cette convention, la définition inductive des entiers pairs (de l'exemple 
2.4) se note 
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(B) 0€ P; 
(l)neP=n+2er. 


Exemple 2.6 Soit Z = {(,)} l'alphabet constitué de la parenthèse ouvrante et de 
la parenthèse fermante. L'ensemble D € Y* des parenthésages bien formés, appelé 
langage de Dyck, est défini inductivement par 

(B) ee D; 

(D) xeD=(x)e D; 

(1) x,ye D = xyE€ D. 


Notation 2.2 On préfère parfois écrire une définition inductive sous la forme de règles 
de déduction : 


TL EX ..…. Ln; € X 
BCX Ti(t1,...,Tn,) E À 
Le principe de cette notation est qu’un trait horizontal — signifie une règle de 


déduction. Ce qui est écrit au dessus est une hypothèse. Ce qui est écrit en dessous est 
une conclusion. Si ce qui est au dessus est vide, alors c’est que la conclusion est valide 
sans hypothèse. 


Notation 2.3 On écrit aussi parfois directement 


T1 Tn; 
b Ti (ét, , LD 
pour chaque b € B, 
ou 
T1 Th; 
be B Ti(t1,..., Tn:) 
ou encore plus rarement parfois 
T1 Tn; 
B PT ses Te) 


2.4 Applications 


2.4.1 Quelques exemples 
Exemple 2.7 (N) La partie X de N définie inductivement par 


n 
0 n +1 


n’est autre que N tout entier. 


Exemple 2.8 (3*) La partie X de Y*, où Y est un alphabet, définie inductivement par 
(B) ee X; 
(1) we X = wa € X, pour chaque a E Y; 
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n'est autre que Y* tout entier. 


Exemple 2.9 (Langage {a"bc"}) Le langage L sur l'alphabet Z — {a,b} des mots 
de la forme a"bc”, n € N, se définit inductivement par 

(B) be L; 

(1) wE L= auce L. 


Exercice 2.5. Définir inductivement l’ensemble des expressions entièrement paren- 
thésées formées à partir d’identificateurs pris dans un ensemble À et des opérateurs + 
et X. 


2.4.2 Arbres binaires étiquetés 


Reprenons le texte suivant du polycopié de INF421 (version 2010-2011) : “la notion 
d’arbre binaire est assez différente des définitions d’arbre libre, arbre enraciné et arbre 
ordonné. Un arbre binaire sur un ensemble fini de sommets est soit vide, soit l’union 
disjointe d’un sommet appelé sa racine, d’un arbre binaire appelé sous-arbre gauche, 
et d’un arbre binaire appelé sous-arbre droit. Il est utile de représenter un arbre binaire 
non vide sous la forme d’un triplet À = (4,,r, Aa)” 

On obtient immédiatement une définition inductive de l’écriture des arbres binaires 
étiquetés à partir de ce texte. 


Exemple 2.10 (Arbres binaires étiquetés) L'ensemble AB des arbres binaires éti- 
quetés par l’ensemble À est la partie de Y*, où Y est l'alphabet 5 — AU {0,(,),,}, 
définie inductivement par 

(B) 0e AB; 

(1) g,de AB = (g,a,d) € AB, pour chaque a € À. 


Remarque 2.3 Dans l'écriture plus haut, (g, a, d) désigne la concaténation du mot de 
longueur 1 (, du mot g, du mot , de longueur 1, du mot a, du mot , de longueur 1, du 
mot d et du mot ) de longueur 1. Tous ces mots sont bien des mots sur l'alphabet Y qui 
contient tous les symboles nécessaires. 


Remarque 2.4 9,d € AB = (g,a,d) € AB, pour chaque a € À désigne le fait que 
l’on répète, pour chaque a € À, la règle g,d € AB = (g,a,d) € AB. C’est donc en 
réalité pas une règle, mais une famille de règles, une pour chaque élément a de À. 


Remarque 2.5 Attention : un arbre binaire n’est pas un arbre ordonné dont tous les 
nœuds sont d’arité au plus 2. 


Exemple 2.11 Par exemple, l'arbre binaire étiqueté 
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et l’arbre binaire étiqueté 


ne sont pas les mêmes, car le premier correspond au mot (((Ÿ,3,0),2,0), 1,0) er le 
second au mot (0,1,((0,3,0),2,0@)). Pourtant si on considère ces arbres comme des 
arbres ordonnés, ce sont les mêmes. 


Exercice 2.6. Soit À un alphabet. On définit récursivement la suite d'ensemble 
(ABh}nen par 

— AB = {0}. 

— ABy4r1 = ABnU{(a,g,d)la € À,g,de AB,} 
Montrer que X =, AB, correspond aussi à l’ensemble AB des arbres binaires 
étiquetés par l’ensemble A. 


2.4.3 Expressions arithmétiques 


On peut définir les expressions arithmétiques bien formées sur l’alphabet Y.., de 
l’exemple[].1] Rappelons que l’on avait défini l’alphabet 


D ue 


Commençons par définir ce qu’est un nombre écrit en base 10. A priori on écrit un 
entier en base 10 sans débuter par un 0 (sauf pour 0). Par exemple 000192 n’est pas 
autorisé. Par contre 192 est bien une écriture valide. 

On obtient la définition inductive suivante. 


Exemple 2.12 L'ensemble N des nombres entiers non-nuls écrits en base 10 est la 
partie de Eexp”, définie inductivement par 
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(B) a € N pour chaque a € {1,2,...,9}; 
(1) ge N = ga € N, pour chaque a € {0,1,2,...,9}. 


On peut ensuite définir les expressions arithmétiques de la façon suivante : 


Exemple 2.13 L'ensemble Arith des expressions arithmétiques est la partie de exp”, 
définie inductivement par 

B) 0€ Arith; 

B) NC Arith; 

1) g,d € Arith = g+d€ Arith; 

1) g,d € Arith = g*xd€ Arith; 

1) g,d€ Arith = g/d € Arith; 

1) g,d € Arith = g—d€e Arith; 

1) gE Arith = (g) € Arith; 


Ainsi, on a (1+2*x4+4x(3+2)) € Arith qui correspond bien à une expression 
valide. Par contre +1 — /2( n’est pas dans Arith. 


2.4.4 Termes 


Les termes sont des arbres ordonnés étiquetés particuliers. Ils jouent un rôle essen- 
tiel dans beaucoup de structures en informatique. 

Soit F — {fo,f1,°-: , fn,°: } un ensemble de symboles, appelés symboles de 
fonctions. À chaque symbole f est associé un entier a(f) € F, que l’on appelle arité 
de f et qui représente le nombre d’arguments du symbole de fonction f. On note F; 
pour le sous-ensemble des symboles de fonctions d’arité . Les symboles de fonctions 
d’arité 0 sont appelés des constantes. 

Soit Z l’alphabet Z — FU {(,),,} constitué de F et de la parenthèse ouvrante, de 
la parenthèse fermante, et de la virgule. 


Définition 2.2 (Termes sur F) L'ensemble T des termes construit sur F est la partie 
de Y* définie inductivement par : 
(B) BHCT 
(c'est-à-dire : les constantes sont des termes) 
(1) ti,t2,--. in ET => fist, ln) ET 
pour chaque entier n, pour chaque symbole f € F, d’arité n. 


Remarque 2.6 Dans la définition plus haute, on parle bien de mots sur l'alphabet Y : 
f(t1,t2,--- ,tn) désigne le mot dont la première lettre est f, la seconde (, les suivantes 
celle de t1, etc. 


Exemple 2.14 Par exemple, on peut fixer F = {0,1, f,g}, avec 0 et 1 d’arité 0 (ce 
sont des constantes), f d’arité 2 et g d’arité 1. 

f(0, g(1)) est un terme sur F. f(g(g(0)), f(1,0)) est un terme sur F. f(1) n’est 
pas un terme sur F. 


Les termes sur F correspondent à des arbres ordonnés étiquetés particuliers : les 
sommets sont étiquetés par les symboles de fonctions de F', et un sommet étiqueté par 
un symbole d’arité k possède exactement k fils. 
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2.5 Preuves par induction 


On va devoir régulièrement prouver des propriétés sur les éléments d’un ensemble 
X défini implicitement. Cela s’avère possible en utilisant ce que l’on appelle la preuve 
par induction, parfois appelée preuve par induction structurelle, qui généralise le prin- 
cipe de la preuve par récurrence. 


Théorème 2.3 (Preuve par induction) Soit X C E un ensemble défini inductivement 
à partir d’un ensemble de base B et de règles R. Soit P un prédicat exprimant une 
propriété d’un élément x € E : c’est-à-dire une propriété P(x) qui est soit vraie soit 
fausse en un élément x € E. 

Si les conditions suivantes sont vérifiées : 


(B) P(x) est vérifiée pour chaque élément x € B ; 
(1) P est héréditaire, c’est-à-dire stable par les règles de R : Formellement, pour 


chaque règle r; € R, pour chaque %1,-:+ ,%n, € E, P(xi),-- , P(xn,) vraies 
impliquent P(x) vraie en x = r(x1,-.: ,Tn,). 


Alors P(x) est vraie pour chaque élément x € X. 


Démonstration: On considère l’ensemble Y des éléments x € E qui vérifient le 
prédicat P(x). Y contient B par la propriété (B). Y est stable par les règles de R par 
propriété (1). L'ensemble X, qui est le plus petit ensemble contenant B et stable par 
les règles de À, est donc inclus dans Y. 


Remarque 2.7 La preuve par induction généralise bien la preuve par récurrence. En 
effet, N se définit inductivement comme dans l'exemple[2.7] Une preuve par induction 
sur cette définition inductive de N correspond à une preuve par récurrence, c’est-à-dire 
aux hypothèses du théorème [2.1] 


Exemple 2.15 Pour prouver par induction que tous les mots du langage défini impli- 
citement dans l'exemple L.9]possèdent autant de a que de c, il suffit de constater que 
c’est vrai pour le mot réduit à une lettre b, qui possède 0 fois la lettre a et la lettre c, et 
que si cela est vrai pour le mot w alors le mot awb possède aussi le même nombre de 
fois la lettre a que la lettre c, à savoir exactement une fois de plus que dans w. 


Exercice 2.7. On considère le sous-ensemble ABS des arbres binaires stricts défini 
comme le sous-ensemble du langage AB (des arbres binaires étiquettés par À) défini 
inductivement par : 
(B) (Ÿ,a,Ü) € ABS, pour chaque a € À. 
(1) g,dEe ABS = (g,a,d) € ABS, pour chaque a € À. 
Montrer 
— qu'un élément de ABS est toujours non-vide et sans sommet avec un seul fils 
non-vide. 
— que dans un arbre binaire strict, le nombre de sommets n vérifie n = 2f — 1, où 
f est le nombre de feuilles. 
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Exercice 2.8. Montrer que tout mot du langage de Dyck possède autant de paren- 
thèses fermantes qu'ouvrantes. 


Exercice 2.9. Montrer que tout expression arithmétique, c’est-à-dire tout mot du 
langage Arith, possède autant de parenthèses fermantes qu'ouvrantes. 


Exercice 2.10. Un arbre binaire est dit équilibré si pour chaque sommet de l'arbre, 
la différence entre la hauteur de son sous-arbre droit et la hauteur de son sous-arbre 
gauche vaut soit —1, 0 ou 1 (i.e. au plus un en valeur absolue). 
— Donner une définition inductive de l’ensemble AV L des arbres binaires équili- 
brés. 
— On définit la suite (un)nenN par uo = 0, uw = 1, et pour tout n > 2, Uun+2 = 
Un+1 + Un + 1. 
Montrer que pour tout x € AVE, n > un+1 où h et n sont respectivement la 
hauteur et le nombre de sommets d’un arbre. 


2.6 Dérivations 


2.6.1 Écriture explicite des éléments : Second théorème du point 
fixe 


Nous avons vu jusque-là plusieurs exemples d’ensembles X définis inductivement. 
L'existence de chaque ensemble X découle du théorème [2.2] et en fait de l’équation 
(2.1) utilisée dans la preuve de celui-ci. 

On parle de définition de X par le haut, puisque l’équation définit X à par- 
tir de sur-ensembles de celui-ci. Cela a clairement l’avantage de montrer facilement 
l'existence d’ensembles définis inductivement, ce que nous avons abondamment uti- 
lisé jusque-là. 

Cependant, cela a le défaut de ne pas dire quels sont exactement les éléments des 
ensembles X obtenus. 

Il est en fait aussi possible de définir chaque ensemble X défini inductivement par 
le bas. On obtient alors une définition explicite des éléments de X, avec en prime une 
façon de les obtenir explicitement. 

C’est ce que dit le résultat suivant : 


Théorème 2.4 (Définition explicite d’un ensemble défini implicitement) Chaque en- 
semble X défini implicitement à partir de l’ensemble de base B et des règles R s'écrit 


aussi 
=): 
neN 


où (Xn)nen est la famille de parties de E définie par récurrence par 
— Xo = B 
— Xn+1 = Xn U Th DU de) 


T1, °°° ,Tn; E Xnetr ER}. 


2.6. DÉRIVATIONS 31 


Autrement dit, tout élément de X est obtenu en partant d’éléments de B et en 
appliquant un nombre fini de fois les règles de À pour obtenir des nouveaux éléments. 

Démonstration: Il suffit de prouver que cet ensemble est le plus petit ensemble qui 
contient B et qu’il est stable par les règles de R. 

D'une part, puisque X,o = B, B est bien dans l’union des X,. D'autre part, si 
l’on prend une règle r; € R, et des éléments %1,--: ,%,, dans l’union des X,,, par 
définition chaque x; est dans un X4; pour un entier k;. Puisque les ensembles X; sont 
croissants (i.e. X; C X;+x% pour tout k, ce qui se prouve facilement par récurrence 
sur k), tous les x1,--:,x,, sont dans X,, pour no = max(k1,--:,k,,). On obtient 
immédiatement que r(æ1,---,%,) est dans X,,+1, ce qui prouve qu’il est bien dans 
l’union des X,. 

Enfin, c’est le plus petit ensemble, car tout ensemble qui contient B et qui est stable 
par les règles de R doit contenir chacun des X,,. Cela se prouve par récurrence sur n. 
C’est vrai au rang n = 0, car un tel ensemble doit contenir X, puisqu'il contient B. 
Supposons l'hypothèse au rang n, c’est-à-dire X contient X,,. Puisque les éléments de 
Xh-+1 sont obtenus à partir d’éléments de X,, € X en appliquant une règle r; € R, X 
contient chacun de ces éléments. 


2.6.2 Arbres de dérivation 


La définition par le bas de X du théorème précédent invite à chercher à garder 
la trace de comment chaque élément est obtenu, en partant de X et en appliquant les 
règles de À. 


Exemple 2.16 Le mot 1+2+3 correspond à une expression arithmétique. En voici une 
preuve. 


1EeN 2EN 
1+2€ Arith 3 € Arith 
1+2+3€ Arith 


Ce n’est pas la seule possible. En effet, on peut aussi écrire 


2EeN 3EeN 
1€ Arith 2+3€ Arith 
1+2+3€ Arith 


Pour coder chaque trace, la notion naturelle qui apparaît est celle de terme, sur un 
ensemble de symboles F bien choisi : on considère que chaque élément b de la base B 
est un symbole d’arité 0. A chaque règle r; € R on associe un symbole d’arité n;. Un 
terme { sur cet ensemble de symboles est appelé une dérivation. 

A chaque dérivation t est associé un élément h(t) comme on s’y attend : si t est 
d’arité 0, on lui associe l’élément b de B correspondant. Sinon, t est de la forme 
Titi," ,fn,), pour une règle r; € R et pour des termes t1,--: ,1»,, et on associe 
à t le résultat de la règle r; appliquée aux éléments h(t1),:-: ,h(t,). 


Exemple 2.17 Pour les expressions arithmétiques, notons par le symbole + d’arité 2, 
la règle g,d € Arith = g+de Arith; 
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La première preuve de l'exemple|2.16|correspond à la dérivation +(+(1,2),3). La 
seconde à la dérivation +(1,+(2,3)). L'image par la fonction h de ces dérivations est 
le mot 1 +2 +3. 


On peut alors reformuler le théorème précédent de la façon suivante. 


Proposition 2.1 Soit un ensemble X° défini implicitement à partir de l’ensemble de 
base B et des règles de R. Soit D l’ensemble des dérivations correspondant à B et à 
R. Alors 

X = {h(tjft e D}. 


Autrement dit, X est précisément l’ensemble des éléments de E qui possèdent une 
dérivation. 

On voit dans l’exemple précédent, qu’un élément de X peut à priori avoir plusieurs 
dérivations. 


Définition 2.3 On dit qu’une définition inductive de X est non ambiguë si la fonction 
h précédente est injective. 


Intuitivement, cela signifie qu’il n’existe qu’une unique façon de construire chaque 
élément de X. 


Exemple 2.18 La définition suivante de N°? est ambigüe. 

(B) (0,0) € N°; 

(1) (n,m) EN? = (n+1,m) € N°: 

(1) (n,m) e N°? = (n,m +1) € N°. 
En effet, on peut par exemple obtenir (1,1) en partant de (0,0) et en appliquant la 
deuxième puis la troisième règle, mais aussi en appliquant la troisième règle puis la 
deuxième règle. 


Exemple 2.19 La définition de Arith de l’exemple|2.13|est ambigüe puisque 1+2+3 
possède plusieurs dérivations. 


Exemple 2.20 Ce problème est intrinsèque aux expressions arithmétiques, puisque 
lorsqu'on écrit 1 + 2 + 3, on ne précise pas dans l'écriture si l’on veut parler du 
résultat de l'addition de 1 à 2 + 3 ou de 3 à 1 + 2, l’idée étant que puisque l'addition 
est associative, cela n'est pas important. 


Exemple 2.21 Pour éviter ce problème potentiel, définissons l’ensemble Arith' des 
expressions arithmétiques parenthésées comme la partie de Xexn", définie inductive- 
ment par 
B) 0€ Arith; 
B) NC Arith'; 
I) g,d € Arith! = 
I) g,d € Arith! = 
1) g,d € Arith' = (g/d) € Arith'; 
1) g,d € Arith' = (g — d) € Arith'; 
1) gE Arith! = (g) € Arith'; 

Cette fois, 1+2+3 n'est pas un mot de Arith'. Par contre, (1+(2+3)) € Arith’ 
et ((1+2)+3) € Arith’. 

L'intérêt de cette écriture est que l’on a cette fois des règles non-ambigües. 


g + d) € Arith'; 
g * d) € Arith'; 


RR LR TRS 
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2.7 Fonctions définies inductivement 


Nous aurons parfois besoin de définir des fonctions sur des ensembles X définis 
inductivement. Cela peut se faire facilement lorsque X admet une définition non am- 
bigüe. 


Théorème 2.5 (Fonction définie inductivement) Soit X C E un ensemble défini in- 
ductivement de façon non ambigüe à partir de l’ensemble de base B et des règles R. 
Soit Y un ensemble. 

Pour qu'une application f de X dans Y soit parfaitement définie, il suffit de se 
donner : 

(B) la valeur de f(x) pour chacun des éléments x € B; 

(1) pour chaque règle r; € R, la valeur de f(x) pour x = ri(t1,-:: ,%n,) en 

fonction de la valeur æ1, ..., &n,, f(æt1), ..., et f(tn;). 


Autrement dit, informellement, si l’on sait “programmer récursivement”, c’est-à- 
dire “décrire de façon récursive la fonction”, alors la fonction est parfaitement définie 
sur l’ensemble inductif X. 

Démonstration: On entend par l’énoncé, qu’il existe alors une unique application f 
de X dans Ÿ qui satisfait ces contraintes. Il suffit de prouver que pour chaque x € X, la 
valeur de f en x est définie de façon unique. Cela se prouve facilement par induction : 
c’est vrai pour les éléments x € B. Si cela est vrai en z1,::: ,%,,, cela est vrai en 
æ = T;(21,""" ,Tn,) : la définition de X étant non ambigüe, x ne peut être obtenu que 
par la règle r; à partir de t1,--: ,%n,. Sa valeur est donc parfaitement définie par la 
contrainte pour la règle r;. 


Exemple 2.22 La fonction factorielle F'act de N dans N se définit inductivement par 
(B) Fact(0) = 1; 
(1) Fact(n +1) = (n +1) x Fact(n). 


Exemple 2.23 La hauteur h d’un arbre binaire étiqueté se définit inductivement par 
(B) h(D) = 0; 
() R((g,a,d)) = 1+max(A(g), h(d)). 


Exemple 2.24 La valeur v d’une expression arithmétique de Arith' se définit inducti- 
vement par (v est une fonction qui va des mots vers les rationnels) 

B) v(0) =0; 

B) v(x) = h(x) pour x € N'; 


1) v((g + d)) = v(g) +v(d); 

1) v((g x d)) = v(g) x v(d); 

1) v((g/d)) = v(g)/v(d), si v(d) 7 0; 
1) v((g — d)) = v(g) — v(d); 

1) v((g)) = v(g); 


où h est la fonction qui à un mot de N associe sa valeur en tant que rationnel : h 
se définit inductivement par 

B) h(a) = a pour chaque a € {1,2,...,9}; 

1) h(ga) = 10 *x h(g) + a pour chaque a € {0,1,2,...,9}. 
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On observera que ces définitions ne sont essentiellement que la traduction de com- 
ment on peut les programmer de façon récursive. L'utilisation d’une définition non- 
ambigüe évitant toute ambiguïté sur l’évaluation. 


Remarque 2.8 Pour les expressions arithmétiques, 1+2*+3 € Arith est aussi ambigüe 
à priori. Un évaluateur qui prendrait en entrée un mot de Arith devrait aussi gérer 
les priorités, et comprendre que 1 + 2 x 3 n’est pas le résultat de la multiplication de 
1 + 2 par 3. En utilisant la définition de Arith!, on évite complétement aussi cette 
difficulté, puisque les expressions codent explicitement comment les évaluer, et une 
définition inductive devient possible. À priori, la valeur d’une expression de Arith ne 
se définit pas aussi simplement inductivement, ne serait-ce qu’en raison du problème 
que la valeur de x + y x z ne s'obtient pas directement à partir de celle de x + y et de 
z uniquement. 


2.8 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de [Arnold and Guessarian, 2005]. Pour une présentation 


plus générale des définitions inductives et des théorèmes de points fixes, nous sug- 


gérons la lecture de [Dowek, 2008]. 
Bibliographie Ce chapitre a été rédigé grâce aux ouvrages [Dowek, 2008] et | Arnold and Guessarian, 2005]. 


Chapitre 3 


Calcul propositionnel 


La logique propositionnelle permet essentiellement de discuter des connecteurs 
grammaticaux comme la négation, la conjonction et la disjonction, en composant des 
propositions à partir de propositions données. Ces connecteurs sont parfois appelés 
aristotéliciens , car ils ont été mis en évidence par Aristote. 

Le calcul propositionnel permet essentiellement de parler de fonctions booléennes, 
c’est-à-dire de fonctions de {0,1}” — {0,1}. En effet, les variables, c’est-à-dire les 
propositions, ne peuvent prendre que deux valeurs, vrai ou faux. 

Le calcul propositionnel tient une grande place en informatique : ne serait-ce parce 
que nos ordinateurs actuels sont digitaux, et travaillent en binaire. Ce qui fait que nos 
processeurs sont essentiellement constitués de portes binaires du type de celles que l’on 
va étudier dans ce chapitre. 

D'un point de vue expressivité logique, le calcul propositionnel reste très limité : 
par exemple, on ne peut pas écrire en calcul propositionnel l’existence d’un objet ayant 
une propriété donnée. Le calcul des prédicats, plus général, que nous étudierons dans 
le chapitre [|] permet lui d’exprimer des propriétés d’objets et des relations entre objets, 
et plus généralement de formaliser le raisonnement mathématique. 

Puisque le calcul propositionnel forme toutefois la base commune de nombreux 
systèmes logiques, et nous allons nous y attarder dans ce chapitre. 


3.1 Syntaxe 


Pour définir formellement et proprement ce langage, nous devons distinguer la syn- 
taxe de la sémantique : la syntaxe décrit comment on écrit les formules. La sémantique 
décrit leur sens. 

Fixons un ensemble fini ou dénombrable P = {po, p1,:::} de symboles que l’on 
appelle variables propositionnelles. 


Définition 3.1 (Formules propositionnelles) L'ensemble des formules propositionnelles 


F sur P est le langage sur l'alphabet P U {£-,A,V,=,e,(,)} défini inductivement 
par les règles suivantes : 
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(B) il contient P : toute variable propositionnelle est une formule proposition- 
nelle ; 

(1) FE Falors-FEeF; 

(1) 5 F,GE Falors(FAG)EF, (FVGOEF (F>=MEF t(F& DE 
Fe 


Il s’agit d’une définition inductive qui est légitime par les considérations du chapitre 
précédent. Il s’agit d’une définition inductive non ambiguë : on peut reformuler ce fait 
par la proposition suivante, parfois appelé théorème de lecture unique. 


Remarque 3.1 La non-ambiguïté vient essentiellement des parenthèses explicites. On 
utilise ici l'astuce utilisée dans le chapitre précédent qui considérait Arith’ plutôt que 
Arith pour permettre d'écrire des expressions sans aucune ambiguïté de lecture. 


Proposition 3.1 (Décomposition / Lecture unique) Soit F une formule proposition- 
nelle. Alors F est d’une, et exactement d’une, des formes suivantes 


1. une variable propositionnelle p € P ; 
—G, où G est une formule propositionnelle ; 
. (GA H) où G'et H sont des formules propositionnelles ; 


G V H) où G et H sont des formules propositionnelles ; 


Q io &R & N 


- ( 
. (G = H) où Get H sont des formules propositionnelles ; 
. (G& H) où Get H sont des formules propositionnelles. 


De plus dans les cas 2., 3., 4., 5. et 6., il y a unicité de la formule G et de la formule H 
avec ces propriétés. 


Le fait qu’une formule se décompose toujours dans un des 6 cas plus hauts est facile 
à établir inductivement. L’unicité de la décomposition découle de l’exercice suivant : 


Exercice 3.1. Montrer que la définition inductive précédente est non-ambiguë, c’est- 
à-dire que G et H sont uniquement définis dans chacun des cas plus haut. 
On pourra procéder de la façon suivante. 
— Montrer que dans toute formule F le nombre de parenthèses ouvrantes est égal 
au nombre de parenthèses fermantes. 
— Montrer que dans tout mot M préfixe de F, on a o(M) > f(M), où o( M) est le 
nombre de parenthèses ouvrantes, et f(M) le nombre de parenthèses fermantes. 
— Montrer que pour toute formule F dont le premier symbole est une parenthèse 
ouvrante, et pour tout mot M préfixe propre de F, on a o(M) > f(M). 
— Montrer que tout mot M préfixe propre de F' n'est pas une formule. 
— En déduire le résultat. 


On appelle sous-formule de F une formule qui apparaît dans la décomposition 
récursive de F. 
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pipiga|pVal|pAg|ipq|pæg 
0! 1 10 0 0 1 1 
110 10 1 0 0 0 
OÙ 1 |1 1 0 1 0 
11 0 |1 1 1 1 1 


FIGURE 3.1 — Tableau de vérité. 


3.2 Sémantique 


Nous allons maintenant définir la sémantique d’une formule propositionnelle, c’est- 
à-dire le sens qu’on lui donne. 

La valeur de vérité d’une formule se définit comme l'interprétation de cette for- 
mule, une fois que l’on s’est fixé la valeur de vérité des variables propositionnelles : le 
principe est d’interpréter les symboles —, V, À, =, & par la négation logique, le ou lo- 
gique (appelé aussi disjonction), le et logique (appelé aussi conjonction), l'implication 
et la double implication (aussi appelée équivalence ) logique. 

Formellement, 


Définition 3.2 (Valuation) Une valuation est une distribution de valeurs de vérité aux 
variables propositionnelles, c'est-à-dire une fonction de P vers {0,1}. 


Dans tout ce qui suit, O0 représente faux, et 1 représente vrai. 


On représente souvent les conditions de la définition suivante sous la forme d’un 
tableau de vérité : voir la figure[3.1] 


Proposition 3.2 Soit v une valuation. 
Par le théorème[2.5| il existe une unique fonction v définie sur tout F qui vérifie les 

conditions suivantes 
B) © étend v : pour toute variable propositionnelle p € P, Ü(p) = u(p); 
Î) la négation s’interprète par la négation logique : 

si Fest de la forme -G, alors G(F) = 1 ssi ü(G) = 0; 
1) A s’interprète comme le et logique : 

si Fest de la forme G À H, alors D(F) = 1 ssi (G) = let v(H) = 1; 
Î) V s’'interprète comme le ou logique : 

si Fest de la forme G V H, alors T(F) = 1 ssi (G) = 1 ou V(H) = 1; 
Î) = s’interprète comme l'implication logique : 

si Fest de la forme G = H, alors ü(F) = 1 ssi U(H) = 1 ou U(G) = 0; 
T1) & s’'interprète comme l’équivalence logique : 

si Fest de la forme G & H, alors D(F) = 1 ssiv(G) = T(H). 


On écrit v H F pour U(F) = 1, et on dit que v est un modèle de F, ou que v 
satisfait F. On note v E£ F dans le cas contraire. La valeur de 5(F) pour la valuation 
v est appelée la valeur de vérité de F' sur v. 
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3.3 Tautologies, formules équivalentes 


On souhaite classer les formules selon leur interprétation. Une classe particulière 
de formules est celles qui sont toujours vraies que l’on appelle les fautologies. 


Définition 3.3 (Tautologie) Une tautologie est une formule F qui est satisfaite par 
toute valuation. On note dans ce cas = F. 


Définition 3.4 (Equivalence) Deux formules F et G sont dites équivalentes si pour 
toute valuation v, D(F) = T(G). On écrit dans ce cas F = G. 


Exemple 3.1 La formule p V —p est une tautologie. Les formules p et ——p sont équi- 
valentes. 


Remarque 3.2 1! est important de bien comprendre que = est un symbole que l’on 
utilise pour écrire une relation entre deux formules, mais que F = G' n'est pas une 
formule propositionnelle. 


Exercice 3.2. Montrer que = est une relation d'équivalence sur les formules. 


3.4 Quelques faits élémentaires 


Exercice 3.3. Montrer que pour toutes formules F' et G, les formules suivantes sont 
des tautologies : 
(F=F), 


(F=(G=F)), 
(F=(G=H))=((F-G)=(F-H))). 


Exercice 3.4. {Idempotence] Montrer que pour toute formule F on a les équiva- 
lences : 


Exercice 3.5. f{Associativité] Montrer que pour toutes formules F, G, H on a les 
équivalences : 


(FA(GAH))=((FAG)AH), 
(FV(GVH))=((FVG)VH). 


En raison de l’associativité, on note souvent F1 V F2 V--:V Fy pour (((F1 V F>)V 
B3)-.-VFi),et F A PA: A F% pour (((F1 À F2) A F3)... A Fy). 
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Remarque 3.3 Exactement comme on le fait avec les expressions arithmétiques : on 
écrit 1+2+3 pour ((1+2)+3) comme pour (1+(2+3)). Voir toutes les discussions 
sur Arith et Arith' dans le chapitre précédent. 


Exercice 3.6. {[Commutativité] Montrer que pour toutes formules F et G on a les 
équivalences : 


(FAG)=(GAF), 


(FVG)=(GVEF). 


Exercice 3.7. {Distributivité] Montrer que pour toutes formules F, G, H on a les 
équivalences : 


(FA(GVH))=((FAG)V(FAH)), 


(FV(GAH)=((FVG)A(FVH)). 


Exercice 3.8. /Lois de Morgan] Montrer que pour toutes formules F' et G on a les 
équivalences : 


-(FAG)=(-FV-G), 


-(FVG)=(-FA-G). 


Exercice 3.9. Absorption] Montrer que pour toutes formules F et G on a les équi- 
valences : 


3.5 Remplacements d’une formule par une autre équi- 
valente 


Nous connaissons maintenant quelques équivalences entre formules, mais nous al- 
lons maintenant nous convaincre qu’on peut utiliser ces équivalences de façon com- 
positionnelle : si l’on remplace dans une formule une sous-formule par une formule 
équivalente, alors on obtient une formule équivalente. 
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3.5.1 Une remarque simple 


Observons tout d’abord que la valeur de vérité d’une formule ne dépend que des 
variables propositionnelles présentes dans la formule : lorsque F est une formule, on 
notera F(p1,--- ,p,) pour dire que la formule F s’écrit avec les variables proposition- 
nelles p1,--: ,p, seulement. 


Proposition 3.3 Soit F(p1,--- ,p,) une formule. Soit v une valuation. La valeur de 
vérité de F sur v ne dépend que de la valeur de v sur {p1,p2,-:- ,Pn}. 


Démonstration: La propriété s’établit facilement par induction structurelle. 


3.5.2 Substitutions 


Il nous faut définir ce que signifie remplacer p par G dans une formule F, noté 
F(G/p). 

Cela donne la définition un peut pédante qui suit, mais nous devons en passer par 
là : 


Définition 3.5 (Substitution de p par G dans F) La formule F(G/p) est définie par 

induction sur la formule F : 

B) Si F est la variable propositionnelle p, alors F(G/p) est la formule G ; 

B) Si F est une variable propositionnelle q, avec q Æ p, alors F(G/p) est la 
formule F'; 

1) Si Fest de la forme —H, alors F(G/p) est la formule -H(G/p) ; 

1) Si Fest de la forme (F1 V F2), alors F(G/p) est la formule (F:(G/p) V 
F(G/p)); 

1) Si Fest de la forme (F1 À F2), alors F(G/p) est la formule (F.(G/p) A 
B(G/p)); 

1) Si Fest de la forme (F1 = F2), alors F(G/p) est la formule (F.(G/p) = 
F(G/p)); 

1) Si Fest de la forme (F1 & F2), alors F(G/p) est la formule (F\(G/p) & 
F(G/p)). 


3.5.3 Compositionnalité de l’équivalence 


On obtient le résultat promis : si l’on remplace dans une formule une sous-formule 
par une formule équivalente, on obtient une formule équivalente. 


Proposition 3.4 Soient F, F',G et G' des formules. Soit p une variable proposition 
nelle. 

— Si Fest une tautologie, alors F(G/p) aussi. 

- Si F = F", alors F(G/p) = F'(G/p). 

- SiG= G' alors F(G/p) = F(G'/p). 


Exercice 3.10. Prouver le résultat par induction structurelle. 
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3.6 Système complet de connecteurs 


Proposition 3.5 Toute formule propositionnelle est équivalente à une formule qui est 
construite uniquement avec les connecteurs = et \\. 


Démonstration: Cela résulte d’une preuve par induction sur la formule. C’est vrai 
pour les formules qui correspondent à des variables propositionnelles. Supposons la 
propriété vraie pour les formules G et Æ, c’est-à-dire supposons que G (respectivement 
H) est équivalente à une formule G’ (respectivement H”) construite uniquement avec 
les connecteurs — et A. 

Si Fest de la forme -G, alors F est équivalente à -G” et l'hypothèse d’induction 
est préservée. 

Si Fest de la forme (G À H), alors F est équivalente à (F” À H') et la propriété 
d’induction est préservée. 

Si Fest de la forme (G V H), en utilisant la deuxième loi de Morgan et le fait que 
K = —-K pour éliminer les doubles négations, on obtient que F = —(-G" A -H') 
qui est bien construite en utilisant uniquement les connecteurs — et A. 

Si Fest de la forme (G — H), alors F est équivalente à (-G’ V H') qui est 
équivalente à une formule construite uniquement avec les connecteurs — et À par les 
cas précédents. 

Si Fest de la forme (G & H), alors F est équivalente à (G = H')A(H' = G') 
qui est équivalente à une formule construite uniquement avec les connecteurs — et À 
par les cas précédents. 

Un ensemble de connecteurs qui a la propriété plus haut pour {—, A} est appelé un 
système complet de connecteurs. 


Exercice 3.11. Montrer que {—,V} est aussi un système complet de connecteurs. 


Exercice 3.12. Donner un connecteur logique binaire tel qu’à lui seul il constitue un 
système complet de connecteurs. 


3.7 Complétude fonctionnelle 


Supposons P = {p1,p2,--- ,p,} fini. Soit V l’ensemble des valuations sur P. 
Puisqu’une valuation est une fonction de {0,1}” dans {0,1}, V contient 2” éléments. 

Chaque formule F sur P peut être vue comme une fonction de V dans {0,1}, que 
l’on appelle valeur de vérité de F': cette fonction est la fonction qui à une valuation v 
associe la valeur de vérité de la formule sur cette valuation. 

Il y a 22° fonctions de V dans {0, 1}. La question qui se pose est de savoir si toutes 
les fonctions peuvent s’écrire comme des formules. La réponse est positive : 


Théorème 3.1 (Complétude fonctionnelle) Supposons P = {p1, p2, :-: ,Pn} fini. Soit 
V l’ensemble des valuations sur P. Toute fonction f de V dans {0, 1} est la valeur de 
vérité d’une formule F sur P. 
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Démonstration: La preuve se fait par récurrence sur le nombre de variables propo- 
sitionnelles n. 

Pour n = 1, il y a quatre fonctions de {0,1}! dans {0,1}, qui se représentent par 
les formules p, -p, p V -p, p À —p. 

Supposons la propriété vraie pour n — 1 variables propositionnelles. Considérons 
P = {p1,.--,pn} et soit f une fonction de {0,1}" dans {0,1}. Chaque valua- 
tion v’ sur {p1,P2, °° ,Pn—1} peut se voir comme la restriction d’une valuation sur 
{p1,°:: ,Pn}. Soit fo (respectivement /f:) la restriction de f à la valuation v telle 
que v(pn) — 0 (resp. v(p») — 1). Les fonctions fo et f1 sont des fonctions défi- 
nies des valuations sur {p1,:-: ,pn-1} dans {0,1} et se représentent par des formules 
G(p1, °°: ,Pn-1) et H(p1,:-: , Pn—1) respectivement par hypothèse de récurrence. La 
fonction f peut alors se représenter par la formule 


(=pn À G{(p1, °°: ,Pn-1)) V (Pn À H(p1,--: ,Pn-1)) 


ce qui prouve l’hypothèse de récurrence au rang n. 


Remarque 3.4 Notre lecteur assidu aura remarqué que la proposition B.5]peur aussi 
se voir comme la conséquence de cette preuve. 


3.8 Formes normales 


3.8.1 Formes normales conjonctives et disjonctives 


On cherche souvent à ramener les formules sous une forme équivalente la plus 
simple possible. 


Définition 3.6 Un littéral est une variable propositionnelle ou sa négation, t.e. de la 
forme p, ou —p, pour p € P. 


Définition 3.7 Une forme normale disjonctive est une disjonction F, VF3--:VF,dek 
formules, k > 1 où chaque formule F;, 1 < i < k est une conjonction Gi \G2---1G4 
de L littéraux (£ pouvant dépendre de i). 


Exemple 3.2 Les formules suivantes sont des formes normales disjonctives 
(@A q)V (-pA =) 
(pAgA=r)V (g A -p)) 
(p A —Q) 
Définition 3.8 Une forme normale conjonctive est une conjonction F1 A F3: - ++ A F%, de 


k formules, k > 1 où chaque formule F, 1 < à < k est une disjonction GG -: -VG4 
de L littéraux (£ pouvant dépendre de i). 
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Exemple 3.3 Les formules suivantes sont des formes normales conjonctives 
(Cp V q) A (pV 0) 
CpV ag) Ar 
(p V q) 


Théorème 3.2 Toute formule sur un nombre fini de variables propositionnelles est 
équivalente à une formule en forme normale conjonctive. 


Théorème 3.3 Toute formule sur un nombre fini de variables propositionnelles est 
équivalente à une formule en forme normale disjonctive. 


Démonstration: Ces deux théorèmes se prouvent par récurrence sur le nombre n 
de variables propositionnelles. 

Dans le cas où n — 1, on a déjà considéré dans la preuve précédente des for- 
mules qui couvrent tous les cas possibles et qui sont en fait à la fois en forme normale 
conjonctive et disjonctive. 

On suppose la propriété vraie pour n — 1 variables propositionnelles. Soit f la 
fonction valeur de vérité associée à la formule F(p1,--- ,p,). Comme dans la dernière 
preuve, on peut construire une formule qui représente f, en écrivant une formule de la 
forme 

(—Pn A G(p1, de Dial) V (Pn A H(p1, He >Pn-1)). 


Par hypothèse de récurrence, G et H sont équivalentes à des formules en forme normale 
disjonctive 
G=(GVGV:-.V Gr) 


H=(H VHV:..V Hi) 


On peut alors écrire 
(-Pn À G) = (=pn À Gi) V (=pn À Ga) VV (pr À Gx) 
qui est en forme normale disjonctive et 
(Pn À H) = (pn À Hi) V (pn À Ha) V-::V (pn À Hx) 


qui est aussi en forme normale disjonctive. La fonction f est donc représentée par la 
disjonction de ces deux formules, et donc par une formule en forme normale disjonc- 
tive. 

Si l’on veut obtenir F'en forme normale conjonctive, alors l’hypothèse d’induction 
produit deux formes normales conjonctives G et H. L’équivalence que l’on utilise est 
alors 

F= ((-Pn V H) A (Pn V G)). 


Remarque 3.5 Notre lecteur assidu aura remarqué que le théorème précédent, comme 
la proposition B.5]peuvent aussi se voir comme la conséquence de cette preuve. 
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3.8.2 Méthodes de transformation 


En pratique, il existe deux méthodes pour déterminer une forme normale disjonc- 
tive, ou conjonctive équivalente à une formule donnée. La première méthode consiste 
à transformer la formule par équivalences successives à l’aide des règles suivantes ap- 
pliquées dans cet ordre : 


1. élimination des connecteurs — par 
(F=G)=(-FVG) 

2. entrée des négations le plus à l’intérieur possible : 
=(FAG)=(-FV -G) 
=(FVG)=(-FA-G) 

3. distributivité de V et A l’un par rapport à l’autre 

FA(GVH))=((FAH)V(FAH)) 
FV(GAH))=((FVH)A(FVH) 


Exemple 3.4 Mettre la formule -(p = (q = r)) V (r = q) sous forme normale 
disjonctive et conjonctive. 
On utilise les équivalences successives 


(bp V (qVr))V (or Va) 


(pA—(-qVr)) V (cr V a) 
(pAgA=r)V (-r V a) 


qui est une forme normale disjonctive. 


(pAgA=r)V (-r V a) 
(ATV q)A(-r V a) 


L'autre méthode consiste à déterminer les valuations v telles que T(F) = 1, et à 
écrire une disjonction de conjonction, chaque conjonction correspondant à une valua- 
tion pour laquelle T(F) = 1. 

La détermination d’une forme normale conjonctive suit le même principe, en échan- 
gant les valuations donnant la valeur 1 avec celles donnant la valeur 0, et en échangant 
conjonction et disjonction. 


Exercice 3.13. Montrer que la forme normale conjonctive et disjonctive d’une for- 
mule peut être exponentiellement plus longue que la taille de la formule. La taille d’une 
formule est définie comme la longueur de la formule vue comme un mot. 
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3.9 Théorème de compacité 


3.9.1 Satisfaction d’un ensemble de formules 


On se donne cette fois un ensemble Y de formules. On cherche à savoir quand 
est-ce qu’on peut satisfaire toutes les formules de Y. 
Commençons par fixer la terminologie. 


Définition 3.9 Soit © un ensemble de formules. 
— Une valuation satisfait X si elle satisfait chaque formule de Y. On dit aussi dans 
ce cas que cette valuation est un modèle de Y:. 
— X est dit consistant (on dit aussi satifiable) s’il possède un modèle. En d’autres 
termes, s’il existe une valuation qui satisfait Y. 
— Y est dit inconsistant, ou contradictoire, dans le cas contraire. 


Définition 3.10 (Conséquence) Soit F une formule. La formule F est dite une consé- 
quence de Y si tout modèle de Y est un modèle de F. On note alors ZE F. 


Exemple 3.5 La formule q est une conséquence de l’ensemble de formules {p, p = q}. 
L'ensemble de formules {p, p — q, a} est inconsistant. 


On peut déjà se convaincre du résultat suivant, qui relève d’un jeu sur les défini- 
tions. 


Proposition 3.6 Toute formule F est une conséquence d’un ensemble Y de formules 
si et seulement si 2 U {-F} est inconsistant. 


Démonstration: Si toute valuation qui satisfait © satisfait F, alors il n’y a pas de 
valuation qui satisfait ZU{-F}. Réciproquement, par l'absurde : s’il y a une valuation 
qui satisfait Ÿ et qui ne satisfait pas F, alors cette valuation satisfait X et —F. 


Exercice 3.14. Montrer que pour toutes formules F et F', {F} EF" si et seulement 
si F = F' est une tautologie. 


Plus fondamentalement, on a le résultat surprenant et fondamental suivant. 


Théorème 3.4 (Théorème de compacité (1ère version)) Soit Y un ensemble de for- 
mules construites sur un ensemble dénombrable P de variables propositionnelles. 
Alors Y est consistant si et seulement si toute partie finie de Y est consistant. 


Remarque 3.6 Remarquons que l'hypothèse P dénombrable n’est pas nécessaire, si 
l’on accepte d'utiliser l'hypothèse de Zorn (l’axiome du choix). On se limitera au cas 
P dénombrable dans ce qui suit. 


En fait, ce théorème peut se reformuler sous la forme suivante 


Théorème 3.5 (Théorème de compacité (2ième version)) Soit Z un ensemble de for- 
mules construites sur un ensemble dénombrable P de variables propositionnelles. 
Alors Y est inconsistant si et seulement si Y possède une partie finie inconsistante. 
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Ou encore sous la forme suivante : 


Théorème 3.6 (Théorème de compacité (3ième version)) Pour tout ensemble Y de 
formules propositionnelles, et pour toute formule propositionnelle F construites sur 
un ensemble dénombrable P de variables propositionnelles, F est une conséquence de 
Z si et seulement si Fest une conséquence d’une partie finie de Y. 


L’équivalence des trois formulations n’est qu’un simple exercice de manipulations 
de définitions. Nous allons prouver la première version du théorème. 

Une des implications est triviale : si Z est consistant, alors toute partie de X est 
consistant, et en particulier les parties finies. 

Nous allons donner deux preuves de l’autre implication. 

Une première preuve qui fait référence à des notions de topologie, en particulier de 
compacité, et qui s’adresse à ceux qui connaissent ces notions, et qui sont amateurs de 
topologie. 

Démonstration:[Preuve topologique] L'espace topologique {0, 1}? (muni de la to- 
pologie produit) est un espace compact, car il s’obtient comme un produit de compacts 
(Théorème de Tychonoff). 

Pour chaque formule propositionnelle F € Y, l’ensemble F des valuations qui la 
satisfont est un ouvert dans {0, 1}P, car la valeur de vérité d’une formule ne dépend que 
d’un nombre fini de variables, celles qui apparaissent dans la formule. Il est également 
fermé puisque celles qui ne satisfont pas F sont celles qui satisfont -F. 

L'hypothèse du théorème entraîne que toute intersection finie de F pour F € Yest 
non-vide. Comme {0,1}? est compact, l'intersection de tous les F pour F € Y est 
donc non-vide. 

Voici une preuve qui évite la topologie. 

Démonstration:[Preuve directe] Considérons P — {p1,p2,--- ,pr,-::} une 
énumération de P. 

Nous allons prouver le lemme suivant : supposons qu’il existe une application v 
de {p1,p2,°-: ,pn} dans {0,1} telle que tout sous-ensemble fini de Y ait un modèle 
dans lequel p1,--: ,p, prennent les valeurs v(p1), ..., v(p,). Alors on peut étendre v 
à {p1, Do," ,Pnr1} avec la même propriété. 

En effet, si v(Pn+1) — 0 ne convient pas, alors il existe un ensemble fini Uo de Y 
qui ne peut pas être satisfait quand p1,:-: ,Pn, Pn+1 prennent les valeurs respectives 
u(p1), ..…, U(pn) et 0. Si U est un sous-ensemble fini quelconque de Y,, alors d’après 
l'hypothèse faite sur v, UoUU a un modèle dans lequel p1,-:: ,p, prennent les valeurs 
v(p1),:-: ,v(ph). Dans ce modèle, la proposition p, +1 prend donc la valeur 1. Autre- 
ment dit, tout sous-ensemble fini U de © a un modèle dans lequel p1,::: ,Pn, Pn+1 
prennent les valeurs respectives v(p1),..…., u(p,) et 1. Dit encore autrement, soit v(pn+1) = 
0 convient auquel cas on peut fixer v(p1+1) — 0, soit v(p1+1) — 0 ne convient pas 
auquel cas on peut fixer v(p+1) — 1 qui convient. 

En utilisant ce lemme, on définit ainsi une valuation v telle que, par récurrence sur 
n, pour chaque n, tout sous-ensemble fini de Ÿ a un modèle dans lequel p1,--: ,p} 
prennent les valeurs v(p1), ..., v(pn). 

Il en résulte que vw satisfait Y : en effet, soit F une formule de Y. F ne dépend 
que d’un ensemble fini p;,,P:,, °°: ,p3, de Variables propositionnelles (celles qui ap- 
paraissent dans F). En considérant n — max(i1,12,--- ,iz), chacune de ces variables 
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pi, est parmi {p1,--: ,p,}. Nous savons alors que le sous ensemble fini {F'} réduit à 
la formule F admet un modèle dans lequel p1,--: ,pA prennent les valeurs v(p1), ..., 
U(Pn), i.e. F est satisfaite par v. 


3.10 Exercices 


Exercice 3.15. Relier les propositions équivalentes. 


1 —(pAQ) a. (-pA-Q) 
2. —(pV a) b. q — (-p) 
3. p— (9) c. (-pV -q) 
4 —(p— 0) d. pA(-Q) 


Exercice 3.16. En additionnant deux nombres dont l'écriture dans le système binaire 
utilise au plus deux chiffres, soit ab et cd, on obtient un nombre d’au plus trois chiffres 
par. Par exemple, 11 + 01 = 100. Donner une expression de p, q et r en fonction de 
a, b, cet d à l’aide des connecteurs usuels. 


Exercice 3.17. Soient F' et G deux formules n'ayant aucune variable propositionnelle 
en commun. Montrer que les deux propriétés suivantes sont équivalentes : 

— La formule (F = G) est une tautologie 

— L'une au moins des formules -F et G est une tautologie. 


*Exercice 3.18. [Théorème d'’interpolation] Soient F et F' telle que F = F' soit 
une tautologie. Montrer qu'il existe une formule propositionnelle C, dont les variables 
propositionnelles apparaissent dans F et F, telle que F = C'et C = F' soient deux 
tautologies. (on pourra raisonner par récurrence sur le nombre de variables qui ont 
au moins une occurence dans F' sans en avoir dans G). 


Exercice 3.19. Application de la compacité au coloriage de graphes] Un graphe 
G = (V,E) est k-coloriable s’il existe une application f de V dans {1,2,...,k} telle 
que pour tout (x,y) € E, f(x) £ f(y). Montrer qu'un graphe est k-coloriable si et 
seulement si chacun de ses sous-graphes finis est k-coloriable. 


*Exercice 3.20. [Applications de la compacité à la théorie des groupes] Un groupe 
G est dit totalement ordonné si on a sur G une relation d’ordre total telle que a < b 
implique ac < bc et ca < cb pour tous a,b,c € G. Montrer que pour qu'un groupe 
abélien G puisse être ordonné, il faut et il suffit que tout sous-groupe de G engendré 
par un ensemble fini d'éléments de G puisse être ordonné. 


3.11 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de l’ouvrage [Cori and Lascar, 1993al] et de [Lassaigne and de Rougemont, 2004]. 
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Bibliographie Ce chapitre a été rédigé en s’inspirant essentiellement de ces deux 


ouvrages : [Cori and Lascar, 1993a] et |Lassaigne and de Rougemont, 2004]. 


Chapitre 4 


Démonstrations 


L'objectif de ce chapitre est de commencer à aborder la question fondamentale 
suivante : qu’est-ce qu’une démonstration ? 

Pour cela, plus précisément, on va se focaliser dans ce chapitre sur le problème 
suivant : on se donne une formule propositionnelle F, et on veut déterminer si Fest 
une tautologie. Une tautologie est aussi appelée un fhéorème. On dit encore que Fest 
valide. 

Cela va nous amener à décrire des algorithmes particuliers. 


4.1 Introduction 


Une première méthode pour résoudre ce problème, qui est celle que nous avons 
utilisée dans le chapitre précédent, est la suivante : si F est de la forme F(p1,--: ,pn), 
on teste pour chacune des 2” valuations v, c’est-à-dire pour les 2° fonctions de {0, 1}" 
dans {0,1}, si v est bien un modèle de F. Si c’est le cas, alors F est une tautologie. 
Dans tout autre cas, F n’est pas une tautologie. Il est facile de programmer une telle 
méthode dans son langage de programmation favori. 

La bonne nouvelle est que cette méthode existe : le problème de déterminer si une 
formule est une tautologie, est décidable, en utilisant la terminologie que nous verrons 
dans les chapitres suivants. 


Remarque 4.1 Cette observation peut sembler étrange et quelque part se contenter de 
peu, mais nous verrons que lorsque l’on considère des logiques plus générales, même 
très simples, cela devient problématique : il n'existe pas toujours d’algorithme pour 
déterminer si une formule Fest une tautologie. 


Cependant, cette méthode est particulièrement inefficace. Elle a l’inconvénient ma- 
jeur de garantir que lorsque F est une tautologie, on fera 2° fois un test du type “la 
valuation v est-elle un modèle de F ?” Lorsque n est grand, 2" explose très vite : si 
l’on peut effectivement programmer la méthode, le programme obtenu sera en pratique 
inutilisable, car prenant un temps énorme, dès que l’on considèrera des formules F 
avec un grand nombre de variables. 
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Revenons alors à notre problème : on peut se dire que dans le raisonnement clas- 
sique en mathématique, la méthode usuelle pour prouver qu’une assertion est un théo- 
rème est de la démontrer. 

Si l’on veut faire mieux que la méthode exhaustive précédente, il y a essentielle- 
ment deux angles d’attaque. Le premier angle d’attaque est de chercher à s’approcher 
de la notion de démonstration dans le raisonnement usuel : des méthodes de preuve 
dans l’esprit de la section suivante apparaissent. Le deuxième angle d’attaque est de 
chercher à produire des algorithmes le plus efficace possible : des méthodes comme 
les preuves par résolution où méthodes par tableaux plus algorithmiques apparaissent 
alors. 

En général, on s’attend à ce qu’une méthode de preuve soit toujours valide : elle 
ne produit que des déductions correctes. Dans tous les cas se pose la question de la 
complétude : est-ce que tous les théorèmes (tautologies) sont prouvables ? 

Dans ce qui suit, on présentera quatre systèmes de déduction valides et complets : 
les méthodes à la Hilbert, la déduction naturelle, la méthode par résolution et la mé- 
thode des tableaux. On ne prouvera la validité et la complétude que de la méthode des 
tableaux. A chaque fois nous noterons par H la notion de preuve sous-jacente : T'H F 
signifie que la formule F se prouve à partir de l’ensemble de formules propositionnelles 
T.Onnotek TsiÿkT. 

A priori, il faudrait un symbole différent + pour chaque notion de démonstration. 

Cependant, les théorèmes de complétude et de validité qui suivent prouvent qu’en 
fait à chaque fois, ce qui est prouvable pour chaque notion de démonstration est exacte- 
ment la même chose, c’est-à-dire exactement les tautologies du calcul propositionnel. 

En résumé : le symbole | et le symbole + désignent exactement la même notion : 
pour chacune des variantes de + évoquées dans ce qui suit, on a+ F' si et seulement si 
EF, c’est-à-dire si et seulement si Fest une tautologie. 


4.2 Démonstrations à la Frege et Hilbert 


Dans ce système de déduction, on part d’un ensemble d’axiomes, qui sont des tau- 
tologies, et on utilise une unique règle de déduction, le modus ponens, aussi appelé 
coupure, qui vise à capturer un type de raisonnement tout à fait naturel en mathéma- 
tique. 

La règle du modus ponens dit qu’à partir de la formule F et d’une formule F = G, 
on déduit G. 

Graphiquement : 

F (F=G 
G 


Exemple 4.1 Par exemple, à partir de (A À B) et de (A A B) = C on déduit C. 


On considère alors un ensemble d’axiomes, qui sont en fait des instances d’un 
nombre fini d’axiomes. 


Définition 4.1 (Instance) On dit qu'une formule Fest une instance d’une formule 
G si F s'obtient en substituant certaines variables propositionnelles de G par des 
formules F. 
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Exemple 4.2 La formule ((C D) (-A (C D))) est une instance de 
(A = (B = À)), en prenant (C = D) pour À, et -A pour B. 


Définition 4.2 (Axiomes de la logique booléenne) Un axiome de la logique booléenne 
est n'importe quelle instance d’une des formules suivantes : 


1 (Xi = (X2 = X;)) (axiome 1 pour l'implication) ; 
2. (Xi = (2 = X3)) = ((XM1 = Xo) = (X1 = X3))) (axiome 2 pour 
l'implication) ; 
3. (X1 = —X;) (axiome I pour la négation) ; 
4. (== X1 = X:) (axiome 2 pour la négation) ; 
5. ((X1 = X2) = (-X2 1X:1)) (axiome 3 pour la négation) ; 
6. (X1 = (X2 = (X1 A X2))) (axiome 1 pour la conjonction) ; 
7. (M1 A X2) = X3) (axiome 2 pour la conjonction) ; 
8. ((X1 A X2) = X2) (axiome 3 pour la conjonction) ; 
9. (X1 = (X1 V X2)) (axiome 1 pour la disjonction) ; 
10. (X2 = (X1 V X2)) (axiome 2 pour la disjonction) ; 
11. ((((X1 V Xo) A (Xi = CA (X2 = C)) = C) (axiome 3 pour la 
disjonction). 


On obtient une notion de démonstration. 


Définition 4.3 (Démonstration par modus ponens) Soit T un ensemble de formules 
propositionnelles, et F une formule propositionnelle. Une preuve (par modus ponens) 
de F à partir de Test une suite finie F1, F2,--- ,F, de formules propositionnelles telle 
que F, est égale à F, et pour tout i, ou bien F; est dans T,, ou bien F; est un axiome de 
la logique booléenne, ou bien F; s'obtient par modus ponens à partir de deux formules 
F;,Fy avec j <ietk <i. 


On note T'H F'si Fest prouvable (par modus ponens) à partir de T°. On note + F 
siüt+ F,et on dit que F est prouvable (par modus ponens) 


Exemple 4.3 Soit F,G, H trois formules propositionnelles. Voici une preuve de (F = 
H) à partir de {(F = G,(G = H)}: 


- F:(G—= 1H) (hypothèse) ; 

- B:((G-+H)=(F-+(G-H)) (instance de l’axiome 1.) ; 

- B:(F-=(G—= H)) (modus ponens à partir de F1 et F2); 

- B:((Fs+(G-+H)=((F-+G)=(F + H))) (instance de l’axiome 
Dÿs 

- E:((F-+G=(F- EH) (modus ponens à partir de F3 et Fi) ; 

- F:(F => G) (hypothèse) ; 


- F:(F = H) (modus ponens à partir de F6 et F5). 
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Exercice 4.1. Prouver (F = F). 


Dans les exercices suivants, on pourra utiliser les exercices précédents pour ré- 
soudre chacune des questions. 


Exercice 4.2. [Theorème de la déduction] Soit T une famille de formules proposi- 
tionnelles, et F,G deux formules propositionnelles. Montrer que T + F = Gest 
équivalent à TÜ{F}+ G. 


Exercice 4.3. Prouver les assertions suivantes : 
- TU{F}E Gest équivalent à TU {-G} + -F. 
— Sion a à la fois T+H Fe TE -F, alors on a T + G pour toute formule G. 


Exercice 4.4.  Prouver que {(-G = G)}t+ G, pour toute formule G. 


Exercice 4.5.  Prouver que si l’on a à la fois TU{F}+ GeaTU{-F}+ G alors 
onaT+rG. 


Exercice 4.6. Prouver les assertions suivantes : 
- {Ft Fr 
- {EGEEFVG 


- {F,-G}+t-(F = G) 
Exercice 4.7. Pour v une fonction partielle de {X;} dans {0,1}, on pose 


Montrer que pour toute formule H dont les variables sont parmi le domaine de V, la 
relation v = H entraîne Ty + H et la relation v £ H entraîne Ty + -H. 


Cette méthode de preuve est valide : en vérifiant que les axiomes sont des tauto- 
logies, il est facile de se convaincre par récurrence sur la longueur n de la preuve du 
résultat suivant : 


Théorème 4.1 (Validité) Toute formule propositionnelle prouvable est une tautologie. 


Ce qui est moins trivial, et plus intéressant est la réciproque : toute tautologie admet 
une preuve de ce type. 


Théorème 4.2 (Complétude) Toute tautologie est prouvable (par modus ponens). 
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Nous ne donnerons pas la preuve de ce résultat, en la faisant correspondre à l’exer- 
cice suivant : 


Exercice 4.8.  Prouver ce résultat en utilisant les exercices précédents : la clé est 
d'utiliser la possibilité de raisonner par cas (exercice 4.5.) et l'exercice 4.7. qui fait 
le lien entre sémantique et syntaxe. 


On vient de décrire un système de déduction qui est très proche de la notion usuelle 
de preuve en mathématique. Cependant, ce système n’est pas facilement exploitable 
pour construire un algorithme qui déterminerait si une formule Fest une tautologie. 

Il est facile de s’en convaincre en tentant de faire les exercices précédents. 


4.3 Démonstration par déduction naturelle 


4.3.1 Règles de la déduction naturelle 


La notion de démonstration précédente est en pratique difficile à utiliser. En effet, 
dans le système précédent, on se contraint quelquepart de garder les hypothèses tout 
au long de la démonstration. On ne peut donc pas facilement traduire une forme de 
raisonnement pourtant courante : nous voulons démontrer que À = B, supposons À et 
démontrons B sous cette hypothèse. Cette remarque mêne à introduire une notion de 
couple formé d’un ensemble fini d’hypothèses, et d’une conclusion. Un tel couple est 
appelé un séquent. 

On considère dans cette section que les propositions incluent aussi L, interprété 
par faux, et T interprété par vrai. 


Définition 4.4 (Séquent) Un séquent est un couple TH À, où T est un ensemble fini 
de propositions et À est une proposition. 


Les règles de déduction de la déduction naturelle sont alors les suivantes : 


TEA axiome pour chaque À € 


=— Îl-intro 


= L-élim 
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T-AVB DALC LBEC 


TEG V-élim 
T,A+B | 
Pers Dr 
T+kA=BT+A ii 
TEB -élim 
T,AHL . 
PET —-1ntro 
T+HA TH-A élim 
DEL à 
FEAV=-A tiers exclu 


Les règles T-intro, A-intro, V-intro, =-intro, —-intro, V-intro et -intro sont appe- 
lées des règles d'introduction et les règles L-élim, A-élim, V-élim, =-élim, —-élim, 
V-élim et --élim des règles d'élimination. Les règles de la déduction naturelle sont 
donc classées en quatre groupes : les règles d’introduction, les règles d’élimination, la 
règle axiome et la règle fiers exclu. 

Une démonstration d’un séquent l + À est une dérivation de ce séquent, c’est-à- 
dire un arbre dont les nœuds sont étiquetés par des séquents dont la racine est étiquetée 
par l'E À, et tel que si un nœud est étiqueté par un séquent À + B, alors ses enfants 
sont étiquetés par des séquents 21 H C1,...,2 + C, tels qu’il existe une règle de 
déduction naturelle, qui permet de déduire AH B deX1+ Ci,..., Ent On. 

Un séquent LH À est donc démontrable s’il existe une démonstration de ce sé- 
quent. 


4.3.2 Validité et complétude 


On peut prouver les résultats suivants : 


Théorème 4.3 (Validité) Pour tout ensemble de formules V et pour toute formule À, 
sil FH À est prouvable, alors À est une conséquence de T. 


Théorème 4.4 (Complétude) Soit L'un ensemble de formules. Soit À une formule qui 
est une une conséquence de T°. 
Alors T'H À est prouvable. 


44 Démonstrations par résolution 


Nous présentons brièvement la notion de preuve par résolution. Cette méthode de 
preuve est peut-être moins naturelle, mais est plus simple à implémenter informatique- 
ment. 

La résolution s’applique à une formule en forme normale conjonctive. Puisque 
toute formule propositionnelle peut se mettre sous forme normale conjonctive cela n’est 
pas restrictif. 
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Remarque 4.2 Tout du moins en apparence. En effet, il faut être plus astucieux que 
dans le chapitre précédent pour transformer une formule en forme normale conjonc- 
tive, si l’on ne veut pas faire exploser la taille des formules et implémenter pratique- 
ment la méthode. 


On appelle clause une disjonction de littéraux. Rappelons qu’un littéral est une 
variable propositionnelle ou sa négation. On convient de représenter une clause c par 
l’ensemble des littéraux sur lesquels porte la disjonction. 


Exemple 4.4 On écrit donc {p,-q,r} plutôt que p V -q Vr. 


Étant donné un littéral u, on note & pour le littéral équivalent à —u : autrement dit, si 
u est la variable propositionnelle p, u vaut -p, et si u est —p, u est p. Enfin on introduit 
une clause vide, notée L], dont la valeur est O0 pour toute valuation. 


Définition 4.5 (Résolvante) Soient C1, C2 deux clauses. On dit que la clause C' est 
une résolvante de C' et C2 s’il existe un littéral u tel que : 

— UE C ‘ 

UE C; 

— C'est donné par (Ci\{u}) U(C2\{a}). 


Exemple 4.5 Les clauses {p, q,r} et {-r,s} admettent la résolvante {p, q, s}. 


Exemple 4.6 Les clauses {p,q} et {-p,-q} admettent deux résolvantes, à savoir 
{a, a} et {p,-p}. Les clauses {p} et {-p} admettent la résolvante 


Cela donne une notion de preuve. 


Définition 4.6 (Preuve par résolution) Soit T un ensemble de clauses. Une preuve 
par résolution de Test une suite finie F1, F2,---,F, de clauses telle que F,, est égale 
à D, et pour tout i, ou bien F; est une clause dans T, ou bien F; est une résolvante de 
deux clauses F;,F} avec ÿ <ietk < 1. 


Remarque 4.3 Le modus ponens, au coeur du système de preuve précédent, consiste 
à dire qu’à partir de la formule F et d’une formule (F = G), on déduit G. Si l’on 
considère que la formule (F = G) est équivalente à la formule (-F V G, le modus 
ponens peut aussi se voir comme dire qu'à partir de la formule F et d’une formule 
(-F V G), on déduit G, ce qui ressemble au concept de résolvante : la résolvante de 
{} er de {F9} est {}. 

D'une certaine façon, la résolvante est un modus ponens généralisé, même si cette 
analogie n’est qu'une analogie et une preuve dans un système de preuve ne peut pas se 
traduire directement dans l’autre. 


Exercice 4.9.  Prouver par résolution 


T= {par}, {p,-0s},{p}, {os}, {a}, &}). 


Cette méthode de preuve est valide (sens facile). 
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Théorème 4.5 (Validité) Toute clause apparaissant dans une preuve par résolution 
de Test une conséquence de T. 


En fait, pour prouver une formule, on raisonne en général dans cette méthode de 
preuve plutôt sur sa négation, et on cherche à prouver que sa négation est contradictoire 
avec les hypothèses. La validité se formule alors en général plutôt de cette façon. 


Corollaire 4.1 (Validité) Si un ensemble de clauses T admet une preuve par résolu- 
tion, alors Test contradictoire. 


Elle s’avère complète (sens plus difficile). 


Théorème 4.6 (Complétude) Soit T un ensemble de clauses contradictoires. Il admet 
une preuve par résolution. 


4.5 Démonstrations par la méthode des tableaux 


Nous avons jusque-là uniquement évoqué des systèmes de déduction valides et 
complets, parfois sans fournir aucune preuve de nos théorèmes. Nous allons étudier 
plus complètement la méthode des tableaux. Nous avons choisi de développer cette 
méthode, car elle est très algorithmique et basée sur la notion d’arbre, ce qui appuiera 
notre argumentaire récurrent sur le fait que la notion d’arbre est partout en informa- 
tique. 


4.5.1 Principe 


Pour simplifier la discussion, on considèrera que les formules propositionnelles ne 
sont écrites qu'avec les connecteurs —, À, V, =. La formule (F & G) sera considérée 
comme une abréviation de la formule ((F = G)A(G= F)). 

Supposons que l’on veuille prouver qu’une formule F est une tautologie. Si la 
formule F est de la forme (F1 À F2), alors on peut chercher à prouver F1 et F2, et 
écrire F1, F2. Si la formule est de la forme (F1 V F2), alors on peut explorer deux 
possibilités, l’une pour explorer le cas de Fi et l’autre pour le cas de F2. 

On va ramener toutes les autres possibilités à ces deux configurations, en utilisant 
les lois de Morgan, et quelques équivalences : si la formule Fest de la forme (F = 
F2), on va la voir comme (F2 V -F) et appliquer la règle du V, et si F est de la forme 
-(F = P),comme (F A-F) et appliquer la règle du À. On traite chacun des autres 
cas à l’aide des lois de Morgan. 

En faisant cela de façon systématique, on va construire un arbre, dont la racine est 
étiquetée par la négation de la formule F : autrement dit, pour prouver une formule F, 
la méthode commence par la négation de la formule F. 

Partons par exemple de la formule F suivante que nous cherchons à prouver : 


((pAg) Tr) (pr) V(y=r))). 
On part donc de la formule —F, c’est-à-dire de 


(((pAg)=ær)=((p=ær)V(a=r))). 
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— en transformant l'implication -(F — F2) en la formule équivalente (F1 A—F2), 
on obtient ((p A g) = r)A-((p = r) V (q = r)) pour se ramener à la règle du 
\. 

— On applique alors la règle du A : on considère les formules ((p À q) = r) et 
(@=ær)V(a=r)). 

— On considère à l’instant d’après la dernière formule, que l’on peut voir par les 
lois de Morgan comme (—{(p = r) A -(q = r)) : on lui associe —(p = r) et 
—(q = r) par la règle du A. 

— On considère alors -(p = r), ce qui donne les formules p et -r. 

— On obtient alors q et —r à partir de -(q = r). 

— Si l’on considère maintenant ((p/A q) = r), que l’on peut voir comme (r V-(pA 
q)), on a le choix par la règle du V entre la formule -(p A q) ou r. 

— Le cas de r est exclus par l’étape précédente, où l’on avait -r. 

— Dans le premier cas, on a encore le choix entre —-p ou -q. Les deux cas sont 
exclus parce que l’on avait avant p et q. 

Puisque toutes les branches mènent à une contradiction, il n’y a aucune situation 

dans laquelle F pourrait être fausse : on sait alors que F est une tautologie. 

Le calcul que l’on vient de faire se représente naturellement par un arbre. 


(((pAg)=r)=((p=ær)V(g=r))) 


(pAg)=ær),-(p=ær)V(ga=r)) 


(pær),-(g= 7) 


p,;7T 


—(p À q) 4 


2 74 


Chaque branche correspond à un scénario possible. Si une branche possède un som- 
met étiqueté par une formule À telle que — A apparaît plus haut sur la même branche 
(ou l’opposé), alors on cesse de développer cette branche, et on dit que la branche est 
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close : cela veut dire qu’il y a une contradiction. Si toutes les branches sont closes, 
alors on dit que l’arbre est clos, et on sait que tous les scénarios sont exclus. 
Considérons maintenant l’exemple de la formule G donnée par 


(pVa) = (r= (= -p))). 


Avec la même méthode, on développe un arbre avec comme racine -G. 


(pv) = (r= (-q= -p))) 


4, 770 


P 
P q 
Cette fois l’arbre a deux branches. La branche de droite est close. La branche de gauche 
n’est pas close, et les variables propositionnelles sur cette branche sont r, q et p. Si 
l’on prend une valuation v telle que v(r) = 1, u(q) = 0, v(p) = 1, la valuation donne 


la valeur 1 à -G, et donc 0 à G. Autrement dit, G n’est pas une tautologie. On dit que 
l’arbre est ouvert. 


4.5.2 Description de la méthode 


Un tableau est un arbre binaire étiqueté dont les sommets sont des ensembles de 
formules propositionnelles et qui est construit récursivement à partir de la racine som- 
met par sommet en utilisant un nombre fini de fois deux types de règles : les règles æ 
et les règles 5. 

On rappelle que pour simplifier la discussion, on considère que les formules pro- 
positionnelles écrites qu'avec les connecteurs —, A, V,=. La formule (F & G) est 
considérée comme une abréviation de la formule ((F = G)A(G=F)). 

Les formules sont découpées en deux classes, la classe a et la classe 5, et à chaque 
formule on associe inductivement deux autres formules par les règles suivantes : 

— Les formules de type a sont les formules du type : 
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1. a = (AA B): on lui associe «1 = À et a = B. 
2. a = -(A V B): on lui associe «1 = À et a2 = -B. 
3. a = -(A = B) : on lui associe «1 = À et «2 = -B. 
4. —- A : on lui associe &1 = @2 = À. 

— Les formules du type 6 sont les formules du type : 
1. 8=-(A AB) :0on lui associe 1 — -À, Ba = -B. 
2. B = (AV B) : on lui associe B1 = À, Ba = B. 
3. B—(A = B) : on lui associe B1 = -À, B2 = B. 


Si B est une branche d’un tableau, on note [JB pour l’ensemble des formules qui 
apparaissent sur un sommet de B. 
Les deux règles de constructions d’un tableau sont les suivantes : 


1. une règle à consiste à prolonger une branche finie d’un tableau T' par le sommet 
étiqueté {a1, 2}, où a est une formule de type « qui apparaît sur un sommet de 


2. une règle 5 consiste à prolonger une branche finie d’un tableau T' par deux fils 
étiquetés respectivement par {61} et {B2}, où B est une formule de type B qui 
apparaît sur un sommet de B. 


Remarque 4.4 Observons que ce n’est pas nécessairement le dernier sommet d’une 
branche B qui est développé à chaque étape, mais une formule quelque part sur la 
branche. 


On dit qu’une branche B est close s’il existe une formule À telle que À et -A 
apparaissent sur la branche B. Dans le cas contraire la branche est dite ouverte. 
Une branche B est développée si 


1. pour toute formule de type a de (JB, «1 € [JB et a € (JB. 
2. pour toute formule de type 8 de (JB, B1 € U B ou B2 € [J B. 


Un tableau est développé si toutes ses branches sont soit closes, soit développées. 
Un tableau est clos si toutes ses branches sont closes. Un tableau est ouvert s’il possède 
une branche ouverte. 

Finalement, un tableau pour une formule À (respectivement pour un ensemble de 
formules Y) est un tableau dont la racine est étiquetée par {A} (respectivement par 


{A]A € 2}. 


4.5.3 Terminaison de la méthode 


Observons tout d’abord que l’on peut toujours appliquer des règles « ou B jusqu’à 
obtenir un tableau développé. 


Proposition 4.1 Si Y est un ensemble fini de formules, alors il existe un tableau déve- 
loppé (et fini) pour Y. 
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Démonstration: Cela se prouve par récurrence sur le nombre n d’éléments de Y. 

Pour le cas n = 1, observons que la longueur des formules «1, &2, B1, et F2 est 
toujours inférieure strictement à la longueur de a et B. Le processus d’extension des 
branches qui ne sont pas closes se termine donc nécessairement après un nombre fini 
d'étapes. Le tableau obtenu au final est développé, sinon il serait possible de l’étendre. 

Pour le cas n > 1, écrivons Z — {F1,-.- , F,}. Considérons par hypothèse de 
récurrence un tableau développé pour 2 = {F,-:.,F,_1}. Si ce tableau est clos 
ou si F, est une variable propositionnelle, alors ce tableau est un tableau développé 
pour Ï. Sinon, on peut étendre toutes les branches ouvertes en appliquant les règles 
correspondantes à la formule F,,, et en développant les branches obtenues : le processus 
termine pour la même raison que pour n = 1. 

Bien entendu, à partir d’une racine donnée, il y a de nombreuses façons de construire 
un tableau développé. 


4.5.4 Validité et complétude 
La méthode précédente donne une méthode de preuve. 


Définition 4.7 On dira qu'une formule F est prouvable par tableau s’il existe un ta- 
bleau clos avec la racine {—F}. On notera dans ce cast F. 


Exercice 4.10. Prouver que À est une conséquence de ((AV-B)AB) par la méthode 
des tableaux, i.e. + (((AV -B) A B) = À). 


Exercice 4.11.  Prouver que —C est une conséquence de ((H A(PVC)) = A)A 
H AA A -P) par la méthode des tableaux. 


La méthode est valide. 
Théorème 4.7 (Validité) Toute formule prouvable est une tautologie. 


Démonstration: On dira qu’une branche B d’un tableau est réalisable s’il existe 
une valuation v telle que v(A) = 1 pour toute formule À € [JB et v(A) = 0 si 
A € (JB. Un tableau est dit réalisable s’il a une branche réalisable. 

Il suffit de prouver le résultat suivant : 


Lemme 4.1 Soit T’ une extension immédiate du tableau T : c’est-à-dire le tableau 
obtenu en appliquant une règle à ou une règle B à T. Si T est réalisable alors T' 
aussi. 


Ce lemme suffit à prouver le théorème : si Fest prouvable, alors il y a un tableau 
clos avec —F comme racine. Cela veut dire que pour toute branche, il y a une formule 
À telle que À et - A apparaissent sur cette branche, et donc aucune des branches de T 
n’est réalisable. Par le lemme, cela veut dire que l’on est parti initialement d’un arbre 
réduit au sommet étiqueté par —F qui n’était pas réalisable. Autrement dit, F est une 
tautologie. 

Il reste à prouver le lemme. Soit B une branche réalisable de T,, et soit B’ la branche 
de T qui est étendue dans T”. Si B Æ B, alors B reste une branche réalisable de T. Si 
B = B}!, alors B est étendue dans 7”, 
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1. soit en une branche B,, par l’application d’une règle a ; 
2. soit en deux branches Bg, et Bg, par l’application d’une règle 65. 


Dans le premier cas, soit a la formule utilisée par la règle, et v une valuation réali- 
sant B : de v(a) = 1, on déduit v(a1) = 1 et v(a2) = 1 : donc v est une valuation qui 
réalise B,, et le tableau T” est réalisable. 

Dans le second cas, soit 5 la formule utilisée par la règle : de v(5) = 1, on déduit 
qu’au moins une des valeurs v(/3,) et u(B2) vaut 1 : donc v réalise l’une des branches 
Bg, et Bg,, et le tableau T” est réalisable. 


4.5.5 Complétude 


La méthode est complète : en d’autres termes, la réciproque du théorème précédent 
est vraie. 


Théorème 4.8 (Complétude) Toute tautologie est prouvable. 


Corollaire 4.2 Soit F' une formule propositionnelle. 
Fest une tautologie si et seulement si elle est prouvable. 


Le reste de cette sous-section est consacré à prouver ce théorème. 

Remarquons tout d’abord que si B est une branche à la fois développée et ouverte 
d’un tableau T,, alors l’ensemble |J B de formules qui apparaissent dans B a les pro- 
priétés suivantes : 

1. il n’y a aucune variable propositionnelle p telle que p € [JB et telle que -p € 

UB; 
2. pour toute formule a € (JB, «1 EJB et a: E (JB; 
3. pour toute formule 8 € (JB, 5 € [JB ou B € (JB. 


Lemme 4.2 Toute branche développée et ouverte d’un tableau est réalisable. 


Démonstration: Soit B une branche développée et ouverte d’un tableau T. On 
définit une valuation v par : 

1. sip EU B, u(p) = 1; 

2. si -p E (JB, v(p) =0; 

3. sip € UB et -p € UJ B, on pose (arbitrairement) v(p) = 1. 

On montre par induction structurelle sur À que : si À € {JB, alors v(A) = 1, et si 
À € (JB, alors v(A) = 0. 

En effet, c’est vrai pour les variables propositionnelles. 

Si À est une formule à, alors «1 € [JB et a € (JB : par hypothèse d’induction, 
v(a1) = 1, v(a2) = 1, et donc v(a) = 1. 

Si À est une formule f, alors 51 € (JB ou B2 € |] B : par hypothèse d’induction, 
v(B1) = 1 ou u(B2) = 1, et donc v(B) = 1. 


Proposition 4.2 S'il existe un tableau clos avec — A comme racine, alors tout tableau 
développé avec la racine -A est clos. 
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Démonstration: Par l'absurde : soit T'un tableau ouvert et développé avec la racine 
— À, et B une branche ouverte de T'. Par le lemme précédent, B est réalisable, et puisque 
— A est dans B, -A est satisfiable. À n’est donc pas une tautologie, et donc n’est pas 
prouvable par tableau : il n’y a donc pas de tableau clos avec la racine -A. 

On a enfin tous les ingrédients pour prouver le théorème[4.8] 

Supposons que À ne soit pas prouvable par tableau, et soit T'un tableau développé 
avec la racine — À : T n’est pas clos. Comme dans la preuve précédente, si B est une 
branche ouverte de T’, alors B est réalisable, et donc -A est satisfiable : autrement dit, 
A n’est pas une tautologie. 


4.5.6 Une conséquence du théorème de compacité 


Définition 4.8 On dira qu’un ensemble Y de formules est réfutable par tableau s’il 
existe un tableau clos avec la racine Y. 


Corollaire 4.3 Tout ensemble Y de formules qui n’est pas satisfiable est réfutable par 
tableau. 


Démonstration: Par le théorème de compacité, un ensemble de formules Y qui 
n’est pas satisfiable possède un sous-ensemble fini Ï9 qui n’est pas satisfiable. Cet 
ensemble fini de formules a une réfutation par tableau, 1.e. il y a un tableau clos avec la 
racine >. Ce tableau donne aussi un tableau clos avec la racine 


4.6 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 

nous suggérons la lecture de [Cori and Lascar, 1993a], de pour les 

méthodes de preuve basées sur le modus ponens, de pour une présentation 

simple des méthodes de preuve basées sur la résolution, et de 
et pour la méthode des tableaux. 


Bibliographie Ce chapitre a été rédigé en s’inspirant essentiellement de l’ouvrage 


|Cori and Lascar, 1993a], de |Dehornoy, 2006] pour la partie sur les méthodes preuves 
Stern, 1994. 


basées sur le modus ponens, de | pour la présentation de la preuve par réso- 


lution. La section sur la méthode des tableaux est reprise de l’ouvrage [Lassaigne and de Rougemont, 20041. 
La partie sur la déduction naturelle est prise de [Dowek, 2008]. 


Chapitre 5 


Calcul des prédicats 


Le calcul propositionnel reste très limité, et ne permet essentiellement que d’expri- 
mer des opérations booléennes sur des propositions. 

Si l’on veut pouvoir raisonner sur des assertions mathématiques, il nous faut auto- 
riser des constructions plus riches. Par exemple, on peut vouloir écrire l’énoncé 


Vx((Premier(x) À x > 1+1) = Impair(x)). (5.1) 


Un tel énoncé n’est pas capturé par la logique propositionnelle. Tout d’abord par ce 
qu’il utilise des prédicats comme Premier(x) dont la valeur de vérité dépend d’une 
variable x, ce qui n’est pas possible en logique propositionnelle. Par ailleurs, on uti- 
lise ici des quantificateurs comme 1, V qui ne sont pas présents non plus en logique 
propositionnelle. 

L’énoncé précédent est un exemple de formule du calcul des prédicats du premier 
ordre. Dans ce cours, on ne parlera que de logique du premier ordre. La terminologie 
premier ordre fait référence au fait que les quantifications existentielles et universelles 
ne sont autorisées que sur les variables. 


Un énoncé du second ordre, on parle plus généralement d’ordre supérieur, serait 
un énoncé où l’on autoriserait les quantifications sur les fonctions ou des relations : par 
exemple, on peut écrire -1f(Vx(f(x) > f(x + 1))) pour signifier qu’il n’existe pas 
de suite infiniment décroissante. On ne cherchera pas à comprendre la théorie derrière 
ce type d’énoncé, car on le verra, les problèmes et difficultés avec le premier ordre sont 
déjà suffisamment nombreux. 

L'objectif de ce chapitre est alors de définir la logique du premier ordre. Comme 
pour la logique propositionnelle, on va le faire en parlant d’abord de la syntaxe, c’est- 
à-dire comment on écrit les formules, puis de leur sémantique. 

Le calcul des prédicats, reste le formalisme le plus courant pour exprimer des pro- 
priétés mathématiques. C’est aussi un formalisme très utilisé en informatique pour dé- 
crire les objets : par exemple, les langages de requêtes à des bases de données sont 
essentiellement basés sur ce formalisme, appliqué à des objets finis, qui représentent 
des données. 
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5.1 Syntaxe 


Pour écrire une formule d’un langage du premier ordre, on utilise certains symboles 
qui sont communs à tous les langages, et certains symboles qui varient d’un langage à 
l’autre. Les symboles communs à tous les langages sont : 

— les connecteurs -, V, A, =,<& ; 
les parenthèses ( et ) et la virgule ,; 
le quantificateur universel V et le quantificateur existentiel 1; 

— un ensemble infini dénombrable de symboles V de variables. 

Les symboles qui peuvent varier d’un langage à l’autre sont capturés par la notion 
de signature. Une signature fixe les symboles de constantes, les symboles de fonctions 
et les symboles de relations qui sont autorisés. 

Formellement : 


Définition 5.1 (Signature d’un langage du premier ordre) La signature 
Z=(C,F,R) 


d’un langage du premier ordre est la donnée : 

— d’un premier ensemble C de symboles, appelés symboles de constantes ; 

— d’un second ensemble F de symboles, appelés symboles de fonctions. À chaque 
symbole de cet ensemble est associé un entier strictement positif, que l’on appelle 
son arité 

— d’un troisième ensemble R de symboles, appelés symboles de relations. À chaque 
symbole de cet ensemble est associé un entier strictement positif, que l’on appelle 
son arité. 

On suppose que V,C, F,R sont des ensembles disjoints deux à deux. 


Une formule du premier ordre sera alors un mot sur l’alphabet 


AE) = VUCUFURU{-,V,A,=,8,(,),,,V,2}. 


Remarque 5.1 On utilisera dans ce qui suit les conventions suivantes : On convient 
que x,y,z,u et v désignent des variables, c’est-à-dire des éléments de V. a,b,c,d 
désigneront des constantes, c'est-à-dire des éléments de C. 


L’intuition est que les symboles de constantes, fonctions et relations auront voca- 
tion ensuite a être interprétés (dans ce que l’on appellera des structures) ; l’arité d’un 
symbole de fonction ou de relation aura pour vocation à correspondre au nombre d’ar- 
guments de la fonction ou de la relation. 


Exemple 5.1 Par exemple, on peut considérer la signature 
Z=({0,1},f{s,+},{]mpair, Premier, =, <}) 


qui possède les symboles de constante O et 1, le symbole de fonction + d’arité 2, le 
symbole de fonction s d’arité 1, les symboles de relations Impairs et Premier d’arité 
1, les symboles de relations = et < d’arité 2. 
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Exemple 5.2 On peut aussi considérer la signature La = ({c, d},{f,g,h},{R}) avec 
c, d deux symboles de constante, f un symbole de fonction d’arité 1, g et h deux sym- 
boles de fonctions d’arité 2, R un symbole de relation d’arité 2. 


On va définir par étapes : d’abord les fermes, qui visent à représenter des objets, 
puis les formules atomiques, qui visent à représenter des relations entre objets, et enfin 
les formules. 


5.1.1 Termes 


Nous avons déjà défini les termes dans le chapitre[?]: ce que nous appelons ici terme 
sur une signature »;, est un terme construit sur l’union de l’ensemble des symboles de 
fonctions de la signature, des symboles de constantes de la signature, et des variables. 

Pour être plus clair, réexprimons notre définition : 


Définition 5.2 (Termes sur une signature) Soit Z = (C, F,R) une signature. 
L'ensemble T des termes sur la signature Y est le langage sur l'alphabet A(S) 
défini inductivement par : 
(B) toute variable est un terme : V CT; 
(B) toute constante est un terme : C CT; 
(1) si f est un symbole de fonction d'arité n et sit1,t2,:-: ,t, sont des termes, 
alors f(t1,--: ,tn) est un terme. 


Définition 5.3 Un terme clos est un terme sans variable. 


Exemple 5.3 +(x,s 


,8(+(1,1))) est un terme sur la signature de l'exemple[S. 1\qui n'est 
pas clos. +(+(s(1), 


(+ 
+(1,1)),s(s(0))) est un terme clos. 

Exemple 5.4 h(c,x), h(y, 2), g(d, h(y, z)) et f(g(d, h(y, 2))) sont des termes sur la 
signature La de l'exemple[5:2] 


5.1.2 Formules atomiques 


Définition 5.4 (Formules atomiques) Soit Z = (C,F,R) une signature. 

Une formule atomique sur la signature Y est un mot sur l’alphabet A(S) de 
la forme R(t1,t2,--- ,tn), où R € R est un symbole de relation d'arité n, et où 
t1,t2,°-: ,tn sont des termes sur Y. 


Exemple 5.5 > (x,+(1,0)) est une formule atomique sur la signature de l’exemple 


= (x,s(y)) aussi. 
Exemple 5.6 R(f(x), g(c, f(d))) est une formule atomique sur Lo. 


Remarque 5.2 On va convenir parfois d'écrire t1 Rt2 pour certains symboles binaires, 
comme =, <, + pour éviter des notations trop lourdes : par exemple, on écrira x > 
1+1pour > (x,+(1,1)). 
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5.1.3 Formules 


Définition 5.5 (Formules) Soit Z = (C,F,R) une signature. 
L'ensemble des formules sur la signature Y est le langage sur l'alphabet A(S) 
défini inductivement par : 
(B) toute formule atomique est une formule ; 
(1) si F est une formule, alors -F est une formule ; 
(1) si F et G sont des formules, alors (FAG),(FVG,(F=G,e(FesG) 
sont des formules ; 
(1) si F est une formule, et si x € V est une variable, alors VxF est une formule, 
et =xF aussi. 


Exemple 5.7 L'énoncéVx((Premier(x)Ax > 1+1) = Impair(x)) est une formule 
sur la signature de l'exemple[S.1] 


Exemple 5.8 2x(s(x) = 1 +0 V Vy x + y > s(x)) aussi. 
Exemple 5.9 Exemples de formules sur la signature Lo : 


— VaVyz((R(x, y) À R(y,2) = R(x,2)) 
= Vay(g(x, y) = CA g(y,x) — c) ’ 

— Va-f(x) = c; 

— Vady- f(x) = c. 


5.2 Premières propriétés et définitions 


5.2.1 Décomposition / Lecture unique 


Comme pour les formules du calcul propositionnel, on peut toujours décomposer 
une formule, et ce de façon unique. 


Proposition 5.1 (Décomposition / Lecture unique) Soit F une formule. Alors F est 
d’une, et exactement d’une, des formes suivantes : 


1. une formule atomique ; 

. QG, où Gest une formule ; 

. (GA H) où G'et H sont des formules ; 
. (GV H) où G'et H sont des formules ; 
(G = H) où Get H sont des formules ; 
. (G& H) où G et H sont des formules ; 


. VxG où Gest une formule et x une variable ; 


NO O GR & R 


8. 2xG où G est une formule et x une variable. 


De plus dans le premier cas, il y a une unique façon de “lire” la formule atomique. 
Dans chacun des autres cas, il y a unicité de la formule G et de la formule H avec 
cette propriété. 
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On peut alors naturellement représenter chaque formule par un arbre (son arbre de 
décomposition, qui est en fait en correspondance immédiate avec son arbre de dériva- 
tion au sens du chapitre|2) : chaque sommet est étiqueté par un symbole de constante, 
de fonction, de relation, ou par les symboles —, À, V,—=,< ou un quantificateur exis- 
tentiel ou universel. 


Exemple 5.10 Par exemple, la formule 


(Va yR(x, y) = 2xR'(x, y, a)) (52) 


se représente par l'arbre suivant 


/ N 3 


LI 
La 
7 


R FA 
T y 
Chaque sous-arbre d’un tel arbre représente une sous-formule de F°. Si l’on préfère : 


Définition 5.6 (Sous-formule) Une formule G est une sous-formule d'une formule F 
si elle apparaît dans la décomposition de F. 


Exercice 5.1. On fixe une signature contenant les symboles de relations R1, Ra 
d’arité respective 1 et 2. On fixe l’ensemble de variables V — {x1,12,x3}. Quelles 
sont les écritures suivantes qui correspondents à des formules : 

= (R1(x1) A Ro(xi, T2, x3)) 

— Væxi(R1(x1) A Rx, T2, æ3)) 

— Vx12R(R(x1) A Ro(xi, æ1)) 

— Vai2x3(R1 (æ1) A Ra(x1, T2, x3)) 


5.2.2 Variables libres, variables liées 


L’intuition de ce qui va suivre est de distinguer les variables liées des variables qui 
ne le sont pas : tout cela est en fait à propos des “Vx” et “2x” qui sont des lieurs : 
lorsqu'on écrit VxF ou 2xF, x devient une variable liée. En d’autres termes, x est 
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une variable muette dans le sens où la valeur de vérité de VxF ou -xF' aura vocation, 
lorsqu'on parlera de la sémantique des formules, à ne pas dépendre de x : on pour- 
rait tout aussi bien écrire VyF(y/x) (respectivement : 3yF(y/x)) où F(y/x) désigne 
intuitivement la formule que l’on obtient en remplaçant x par y dans F. 


Remarque 5.3 On a le même phénomène dans des symboles comme le symbole in- 
tégrale en mathématique : dans l’expression Le f(t)dt, la variable t est une variable 


je pe. fo DL 
muette (liée). En particulier L f(u)du est exactement la même intégrale. 
Faisons cela toutefois très proprement. Une même variable peut apparaître plusieurs 


fois dans une formule : nous avons besoin de savoir repérer chaque occurrence, en 
faisant attention aux 2 et V. 


Définition 5.7 (Occurrence) Une occurrence d’une variable x dans une formule F 
est un entier n tel que le nème symbole du mot F est x et tel que le (n— 1)ème symbole 
ne soit pas V ni 1. 
Exemple 5.11 8 et 17 sont des occurrences de x dans la formule 6-2. 7etld n'en 
sont pas : T parce que le Tème symbole de F n’est pas un x (c’est une parenthèse 


ouvrante) et 14 parce que le 14ème symbole de F qui est bien un x est quantifié par un 
il existe. 


Définition 5.8 (Variable libre, variable liée) — Une occurrence d’une variable x 
dans une formule F est une occurrence liée si cette occurrence apparaît dans 
une sous-formule de F qui commence par un quantificateur Vx ou 2x. Sinon, on 
dit que l'occurrence est libre. 

— Une variable est libre dans une formule si elle possède au moins une occurrence 
libre dans la formule. 
— Une formule F' est close si elle ne possède pas de variables libres. 


Exemple 5.12 Dans la formule 6-2}, les occurrences 8, 17 et 10 de x sont liées. L’oc- 
currence 19 de y est libre. 


Exemple 5.13 Dans la formule (R(x, 2) = Vz(R(y, 2) V y = 2)), la seule occur- 
rence de x est libre, les deux occurrences de y sont libres. La première (plus pe- 
tite) occurrence de z est libre, et les autres sont liées. La formule Va Vz(R(x,z) = 
Jy(R(y, 2) V y = z)) est close. 


La notation F(x1,--- ,xx) signifie que les variables libres de F sont parmi æ1,--- ,tx. 


Exercice 5.2. Trouver les variables libres et les occurences libres dans les formules 
suivantes : 

Ax(l(x) A m(x)) 

— (Axl(x)) A m(x)) 


Exercice 5.3. Montrer que les variables libres {(F) d’une formule F s’obtiennent 
par la définition inductive suivante : 

L(R(E,--- ,tn)) = {aile € V'et x; apparaît dans R(t1,-:- ,tn)}; 

£(-G) = (QG); 

U(GVH)=U(GAH)=4(G-= H)=U{Ges H)=U{(GU{,(AH); 

L(VaF) = {(3xF) = 4((F)\{x}. 
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5.3 Sémantique 


Nous pouvons maintenant parler du sens que l’on donne aux formules. En fait, pour 
donner un sens aux formules, il faut fixer un sens aux symboles de la signature, et c’est 
l’objet de la notion de structure. 


Définition 5.9 (Structure) Soit Z = (C,F,R) une signature. 
Une structure M de signature Y est la donnée : 
— d’un ensemble non-vide M, appelé ensemble de base, ou domaine de la struc- 
ture ; 
d'un élément, noté €, pour chaque symbole de constante c € C ; 
— d’une fonction, notée f°*, de M" — M pour chaque symbole de fonction f € F 
d’arité n ; 
— d’un sous-ensemble, noté R°*, de M" pour chaque symbole de relation R € F 
d’arité n. 


On dit que la constante c (respectivement la fonction f, la relation À) est interprétée 
par ©? (resp. f?, R°). Une structure est parfois aussi appelée une réalisation de la 
signature. 


Exemple 5.14 Une réalisation de la signature Z = ({0,1},{+,—},{=,>}) corres- 
pond à l’ensemble de base N des entiers naturels, avec 0 interprété par l’entier 0, 1 
par 1, + par l’addition, — par la soustraction, — par l'égalité sur les entiers : c’est-à- 
dire par le sous-ensemble {(x,x)|x € N}, et > par l’ordre sur les entiers, c’est-à-dire 
par le sous-ensemble {(x,y)lx > y}. 

On peut la noter (N,=, <, Impair, Premier, s, +,0, 1). 


Exemple 5.15 Une autre réalisation de cette signature correspond à l’ensemble de 
base R des réels, où 0 est interprété par le réel 0, 1 est interprété par le réel 1, + par 
l'addition, — la soustraction, et = par l'égalité sur les réels, et > par l’ordre sur les 
réels. 

On peut la noter (R, =, <, Impair, Premier, s, +,0, 1). 


Exemple 5.16 On peut obtenir une réalisation de la signature L2 en considérant l’en- 
semble de base R des réels, en interprétant R comme la relation d'ordre < sur les 
réels, la fonction f comme la fonction qui à x associe x + 1, les fonctions g et h 
comme l'addition et la multiplication, les constantes c et d comme 0 et 1. 

On peut la noter (R,<,5,+,x,0,1). 


On va ensuite utiliser la notion de structure pour interpréter les termes, les formules 
atomiques, puis inductivement les formules, comme on peut s’y attendre. 


5.3.1 Interprétation des termes 


Définition 5.10 (Valuation) Fixons une structure M. Une valuation v est une distri- 
bution de valeurs aux variables, c’est-à-dire une fonction de V vers le domaine M de 
la structure M. 
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Définition 5.11 (Interprétation des termes) Soit M une structure de signature X = 
(C,F,R). 
Soit t un terme de la forme t(x1,--- ,xx) sur Y de variables libres x1,-:- ,%%. 
Soit v une valuation. 
L'interprétation &? du terme t pour la valuation v, aussi notée t*[v|, ou t? est 
définie inductivement de la façon suivante : 
(B) toute variable est interprétée par sa valeur par la valuation : si t est la va- 
riable x, € v, alors test v(x;) ; 
(B) toute constante est interprétée par son interprétation dans la structure : sit 
est la constante c € C, alors t* est C? ; 
(1) chaque symbole de fonction est interprété par son interprétation dans la struc- 
ture : sitestleterme f(t1,:-: ,t,), alors tt est FAR (IN,... M), où tt... 
sont les interprétations respectives des termes t1,::: ,tn. 


Remarque 5.4 L'interprétation d’un terme est un élément de M, où M est l’ensemble 
de base de la structure M : les termes désignent donc des éléments de la structure. 


Exemple 5.17 Soit N la structure (N,<,5,+, X,0, 1) de signature 


La — ({c, d}, {f,9,k},{R}) : 


— l'interprétation du terme h(d, x) pour une valuation telle que v(x) = 2 est 2. 
— l'interprétation du terme f(g(d, h(y,z))) pour une valuation telle que v(y) = 
2,v(z) = 3 est 8. 


5.3.2 Interprétations des formules atomiques 


Une formule atomique F = F(x1,---,x4) est un objet qui s’interprète soit par 
vrai soit par faux en une valuation v. Lorsque F s’interprète par vrai, on dit que /a 
valuation v satisfait F, et on note ce fait v H F. On note v E£ F dans le cas contraire. 

Il ne nous reste plus qu’à définir formellement cette notion : 


Définition 5.12 (Interpétation d’une formule atomique) Soit M une structure de si- 
gnature 2 = (C,F,R). 

La valuation v satisfait la formule atomique R(t1,t2,--- ,tn) de variables libres 
a, 2x Si (Eu), tu], € u]) € R, où R° est l'interprétation du sym- 
bole R dans la structure. 


Exemple 5.18 Par exemple, sur la structure de l'exemple x > 1+1 5s'interprète 
par 1 (vrai) en la valuation v(x) = 5, et par 0 (faux) en la valuation v(x) — 0. La 
formule atomique O = 1 s’interprète par 0 (faux). 


Exemple 5.19 Sur la structure N° de l'exemple la formule atomique R(f(c), 
h(c, f(d))) s’interprète par faux. 
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5.3.3 Interprétation des formules 


Plus généralement, une formule F = F(x1,--- ,x}) est un objet qui s’interprète 
soit par vrai soit par faux en une valuation v. Lorsque F s’interprète par vrai, on dit 
toujours que la valuation v satisfait F, et on note toujours ce fait vu = F,etuF 
pour le cas contraire. 


Définition 5.13 (Inteprétation d’une formule) Soit M une structure de signature © = 
(C,F,R). 
L'expression “la valuation v satisfait la formule F = F(x1,--- ,xx)”, notée v EH 
F, se définit inductivement de la façon suivante : 


B) elle a déjà été définie pour une formule atomique ; 
,V,A,=,S sont interprétés exactement comme dans le calcul propositionnel : 
Î) la négation s’interprète par la négation logique : 
si Fest de la forme -G, alors vE F'ssiv £G'; 
T1) A s’'interprète comme une conjonction logique : 
si Fest de la forme (GA H), alborsvÈ Fssiv=kGevkH; 
Î) V s’'interprète comme le ou logique : 
si Fest de la forme (G V H), alors v E Fssiv= GouvkH; 
1) = s’interprète comme l'implication logique : 
si Fest de la forme (G = H), alors vE Fssivk Houv£G; 
1) & s’'interprète comme l’équivalence logique : 
si Fest de la forme (G & H), alors v = Fssi(vhk Getv=H)ou(vkG 
et vu & H). 
3x et Vx sont interprétés comme des quantifications existentielles et universelles : 


(1) si F est de la forme VxoG{(xo, t1,--: ,x4), alors vu F ssi pour tout élément 
ao € M v' À G, où v' est la valuation telle que v'(xo) = ào, et v'(x) = v(x) 
pour tout t £ To; 

(1) si F est de la forme 2x0G(to0,%1,: ++ ,æx), alors v = F ssi pour un certain 
élément ao € M, on a v' = G, où v' est la valuation telle que v’(xo) = à, et 
v'(x) = v(x) pour tout x £ %o. 


Exemple 5.20 — La formule F(x) définie par VyR(x, y) est vraie dans la struc- 
ture N° pour 0, maïs fausse pour les autres entiers. 
— La formule G(x) définie par 2yx = f(y) est vraie dans la structure N pour les 
entiers disctincts de 0 et fausse pour 0. 
— La formule close VaWzay(x = c À g(h(x,y,z) = c) du langage La est vraie 
dans (R <,5,+, x, 0, 1) et fausse dans N = (N,<,5,+,x,0,1). 


Dans le cas où la valuation v satisfait la formule F, on dit aussi que F est valide en 
v. Dans le cas contraire, on dit que Fest fausse en v. 


Définition 5.14 (Modèle d’une formule) Pour une formule F close, la satisfaction de 
F dans une structure M ne dépend pas de la valuation v. Dans le cas où la formule F 
est vraie, on dit que la structure M est un modèle de F, ce que l'onnote ME F. 
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Exercice 5.4. Soit Y une signature constitutée d’une relation binaire R et du prédicat 
=. Ecrire une formule qui est valide si et seulement si R est un ordre (on pourra 
supposer que = s’interpréte par l'égalité). 


5.3.4 Substitutions 


Définition 5.15 (Substitution dans un terme) Etant donné un terme t et une variable 
x apparaissant dans ce terme, on peut remplacer toutes les occurences de x par un 
autre terme t’. Le nouveau terme est dit obtenu par substitution de t' à x dans t, et est 
noté t(t'/x). 


Exemple 5.21 Le résultat de la substitution de f(h(u, y)) à x dans le terme g(y, h(c, x)) 
est g(y, h(c, f(h(u,y)))). Le résultat de la substitution de g(x, z) à y dans ce nouveau 
terme est 


g(g(x, 2), h(c, f(h(u, gx, z))))). 


Pour effectuer une subtitution d’un terme à une variable libre dans une formule, il 
est nécessaire de prenre quelques précautions. Sinon, la signification de la formule peut 
être complétément modifiée par le phénomène de capture de variable. 


Exemple 5.22 Soit F(x) la formule y(g(y,y) = x). Dans la structure N° où g est 
interprétée par l’addition la signification de F(x) est claire : F(x) est vraie en x si et 
seulement si x est pair. 

Si l’on remplace la variable x par z, la formule obtenue possède la même signifi- 
cation que la formule F(x) (au renommage près de la variable libre) : : F(2) est vraie 
en z si et seulement si z est pair 

Mais si l’on remplace x par y, la formule obtenue y(g(y, y) = y) est une formule 
close qui est vraie dans la structure N. La variable x a été remplacée par une variable 
qui est quantifiée dans la formule F. 


Définition 5.16 (Substitution) La Substitution d’un terme t à une variable libre x 
dans une formule F est obtenue en remplaçant toutes les occurences libres de cette 
variable par le terme t, sous réserve que la condition suivante soit vérifiée : pour 
chaque variable y apparaissant dans t, x n’a pas d’occurence libre qui se trouve dans 
une sous-formule de F commençant par une quantification V ou 2. Le résultat de cette 
substitution, si elle est possible, est notée F(t/x). 


Exemple 5.23 Le résultat de la substitution du terme f(2) à la variable x dans la 
formule F(x) donnée par 


(R(c,æ) A x = c) À (yg(y, y) = x)) 


est la formule 


(Re, f(2)) À =f(e) = 0) À (yg(y, y) = FA). 


Proposition 5.2 Si F est une formule, x une variable libre dans F, et t un terme tel 
que la substitution de t à x dans F soit définie, alors les formules (VxF = F(t,x)) et 
(F(t/x) = 2xF) sont valides. 
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Démonstration: On montre par induction sur la formule F que la satisfaction de 
la formule F(t/x) par la valuation v est équivalente à celle de la formule F(x) par la 
valuation vi où v, est obtenue à partir de v en donnant à x l’interprétation de t pour la 
valuation v. 

Les seuls cas qui nécessitent une justification sont ceux où la formule F est de 
la forme VG et 2G. D’après l’hypothèse sur la substitution de { à x, la quantification 
considérée porte sur une variable 7 distincte à la fois de x et de toutes les variables de t. 
Il suffit donc d’examiner la satisfaction de la formue G(t/x) par une valuation v’ égale 
à v sauf sur y. Par l'hypothèse d’induction sur G, la formule G(t/x) est satisfaite par 
v' si et seulement si Gest satisfaite par la valuation v{ où v' est obtenue à partir de v’ 
en donnant à x l’interprétation de t pour la valuation v’ : en effet, v et v’ sont égales 
sur toutes les variables apparaissant dans le terme t. 


5.4 Equivalence. Formes normales 


5.4.1 Formules équivalentes 


Définition 5.17 Soit Z = (C,F,R) une signature. 

— Une structure M satisfait la formule F(x1,--- ,xx) si elle satisfait la formule 
close Vx: ---VxxF(x1,--: ,2%3). Cette dernière formule est appelée la clôture 
universelle de F. 

— Une formule close Fest dite valide si elle est satisfaite par toute structure M. 

— Une formule Fest dite valide si sa clôture universelle est valide. 

— Deux formules F et G sont équivalentes si pour toute structure, et pour toute 
valuation v elle prennent la même valeur de vérité. On note F = G dans ce cas. 


Exercice 5.5. Montrer que la relation = est une relation d'équivalence. 


Proposition 5.3 Soit F'une formule. On a les équivalences suivantes : 


—ViE = 22x-F 


—diF = Vx-F 


VaVyE = VyYxF 


dx IyE = y33xF 


Proposition 5.4 Supposons que la variable x n’est pas libre dans la formule G. Soit 
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F'une formule. On a alors les équivalences suivantes : 


VrG = G=G (53) 
VaFVG) = Va(FVG) (5.4) 
VrFAG) = Va(FAG) (5.5) 
GFVG) = (FVG) (5.6) 
IxFAG) = (FAG (5.7) 
GAVxF) = Vx(GAF) (5.8) 
GVVzF) = Vr(GVF) (5.9) 
GAZxF) = (GAF) (5.10) 
GV2IxF) = (GVF) (5.11) 

(VxF3G) = %(F-+6G) (5.12) 
FC) = VF) (5.13) 
(G=VxF) = Vx(G=F) (5.14) 
(G=3xF) = (G=F) (5.15) 


Chacune des équivalences étant en fait assez simple à établir, mais fastidieuse, nous 
laissons les preuves en exercice. 


Exercice 5.6. Prouver la proposition[S.4] 


Exercice 5.7. Les propositions suivantes sont-elles équivalentes ? Si non, celle de 
gauche implique-t-elle celle de droite ? 


1. —(2xP(x)) et (Vx-P(x)) 
VxP(x) À Q(x)) et ((VxP(x)) À (VrQ(x) 
(VzP(x)) V (VrQ(x))) et (VzP(x) V Q(x 
( 
( 


TS 


a 


V 
dxP(x) V Q(x)) et ((AxP(x)) V( 
AxP(x) À Q(x)) er ( ( 
dx VyP(x,y)) et (VyaxP(x, y)) 


V 
Â 


- ( 
- ( 
( 
( 
( 


5.4.2 Forme normale prénexe 


Définition 5.18 (Forme prénexe) Une formule F est dite en forme prénexe si elle est 
de la forme 

Q1%1Q2%2 + QnEnF" 
où chacun des Q,; est soit un quantificateur V, soit un quantificateur 2, et F' est une 
formule qui ne contient aucun quantificateur. 


Proposition 5.5 Toute formule F est équivalente à une formule prénexe G. 


Démonstration: Par induction structurelle sur F. 

Cas de base. Si F est de la forme R(t1,--- ,t,), pour un symbole de relation R, 
alors Fest sous forme prénexe. 

Cas inductif : 
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— si Fest de la forme VxG ou 2xG, par hypothèse d’induction G est équivalente 
à G’ prénexe et donc F est équivalent à VxG’ ou 2xG” qui est prénexe. 

— si Fest de la forme -G, par hypothèse d’induction Gest équivalente à G' pré- 
nexe de la forme Q;x71Q22 : :: QutnG”'. En utilisant les équivalences de la pro- 
position|5.3] F est équivalente à Q21Q 72 ++: Q,xn-G”, en prenant Q! = V 
si Q; = Jet Qi = si Q; = V. 

— Si Fest de la forme (GA H) par hypothèse d’induction Get H sont équivalentes 
à des formules G’ et H' en forme prénexe. En appliquant les équivalences 
à (5.11), on peut faire “remonter” les quantificateurs en tête de formule : on doit 
toutefois procéder avec soin, car si par exemple F = (F3 À F2) = ((VxFi) A 
F3) avec x libre dans F, nous devons d’abord renommer la variable x dans Fi 
en remplaçant x par une nouvelle variable z n’apparaissant ni dans F3 ni dans 
F;, de façon à bien pouvoir utiliser l’équivalence dont on a besoin parmi les 
équivalences à (5.11). 

— Les autres cas se traitent selon le même principe, en utilisant les équations des 
deux propositions précédentes. 


En utilisant les équivalences similaires à celles écrites dans le calcul propositionnel, 
on peut même aller plus loin : 


Proposition 5.6 Toute formule F est équivalente à une formule prénexe G, où F" est 
en forme normale conjonctive. 


Proposition 5.7 Toute formule F est équivalente à une formule prénexe G, où F" est 
en forme normale disjonctive. 


Nous laissons à notre lecteur le soin d’imaginer ce que veut bien vouloir dire forme 
normale conjonctive et disjonctive pour une formule sans quantificateur de la logique 
du premier ordre (Réponse pour forme normale conjonctive : F”, la formule sans quan- 
üficateur, est soit une clause soit une conjonction de clauses, une clause étant une dis- 
jonction de littéraux, et un littéral soit une formule atomique ou une négation d’une 
formule atomique). 


Exercice 5.8. Déterminer une formule prénexe équivalente à 


GrP(x) A Vr(1yQ(y) + R(x))). 


Exercice 5.9. Déterminer une formule prénexe équivalente à 


(Va dyR(x, y) = Vray(R(x, y) A V2(Rxz = (Ryz V y = 2)))) 


VaVy((R(x, y) À x = y) > (y = g(x, h(z,2)))). 
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5.5 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de [Cori and Lascar, 1993a], [Dowek, 2008] et [Lassaigne and de Rougemont, 20041. 


Bibliographie Ce chapitre a été rédigé en s’inspirant essentiellement des ouvrages 


|Cori and Lascar, 1993a] et [Lassaigne and de Rougemont, 20041. 


Chapitre 6 


Modèles. Complétude. 


Nous pouvons maintenant décrire différents objets, et parler de leurs propriétés. 
Nous avons en effet tous les ingrédients pour parler de modèles et de théories. Nous 
nous intéresserons ensuite au théorème de complétude 

Le concept de base est celui de théorie. 


Définition 6.1 (Théorie) — Une théorie T est un ensemble de formules closes sur 
une signature donnée. Les formules d’une théorie sont appelées les axiomes de 
cette théorie. 

— Une structure M est un modèle de la théorie T si M est un modèle de chacune 
des formules de la théorie. 


Définition 6.2 (Théorie consistante) Une théorie est dite consistante si elle possède 
un modèle. Elle est dite inconsistante dans le cas contraire. 


Bien entendu, les théories inconsistantes sont de peu d’intérêt. 


Remarque 6.1 D'un point de vue informatique, on peut voir une théorie comme la 
spécification d’un objet : on décrit l’objet à l’aide de la logique du premier ordre, i.e. 
à l’aide des axiomes qui le décrivent. 

Une spécification (théorie) consistante est donc ni plus ni moins qu'une théorie qui 
spécifie au moins un objet. 


Remarque 6.2 Dans ce contexte, la question de la complétude est de savoir si l’on 
décrit bien l’objet en question, ou la classe des objets en question : le théorème de 
complétude permet de dire que oui pour une spécification consistante, tant que l’on 
s'intéresse à la classe de tous les modèles de ces spécifications. 


Nous allons commencer par donner différents exemples de théories, pour rendre 
notre discussion beaucoup moins abstraite. 
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6.1 Exemples de théories 


6.1.1 Graphe 


Un graphe orienté peut se voir comme un modèle de la théorie sans axiome sur la 
signature © — ({),0,{E}), où le symbole de relation E est d’arité 2 : E(x, y) signifie 
qu’il y à un arc entre x et y. 


Exemple 6.1 La formule Ay(E(x, y) À Vz(E(x, z) = x = y)) est vraie en x si et 
seulement si x est de degré extérieur 1 (modulo le commentaire de la sous-section qui 
suit sur l'égalité). 


Un graphe non-orienté peut se voir comme un modèle de la théorie avec l’unique 
axiome 


VaVy (E(x,y) & E(y,x)), (6.1) 


sur la même signature. Cet axiome signifie que s’il y a un arc entre x et y, alors il y en 
a aussi un de y vers x et réciproquement. 


Exemple 6.2 Voici 2 graphes (non-orientés). 


La formule 2aVWy(-(x = y) = Elx,y)) est satisfaite sur le premier et pas sur le 
second. 


6.1.2 Remarques simples 


Remarque 6.3 Sur la signature © = (0,0,{E}), il n’y a aucun terme. On ne peut 
donc pas désigner un sommet particulier autrement que par une variable libre, ou via 
des quantifications. 
Si l’on veut désigner un ou des sommets particuliers, on peut ajouter un ou des 
symboles de constantes. On peut considérer la signature (V,0, {E}) où V = {a,b,c}. 
Par exemple, le graphe 
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est un modèle de E(a,b) À E(b, c) À E(a, c). 
Mais attention, ce n’est pas le seul : le graphe 


en est aussi un modèle : le domaine d’un modèle peut contenir des éléments qui ne 
correspondent à aucun terme. 
Par ailleurs l’interprétation de a, b ou c pourrait être la même. 


Exemple 6.3 On peut aussi parfois se passer de constantes. La formule 


drdy2(-(x = y)A=(y = 2)A-(x = 2)AE (x, y)AE (y, 2) AE (x, 2)AVt(E = xVt = yVt = z)) 

(6.2) 
caractérise les triangles comme le graphe plus haut (modulo le commentaire de la 
sous-section qui suit sur l'égalité). 


Remarque 6.4 Attention : toutes les propriétés ne peuvent pas s’écrire facilement. 
Par exemple, on peut prouver qu'il n’est pas possible d'écrire une formule (du premier 
ordre) qui caractériserait les graphes connexes. Exercice : essayer de l’écrire pour 
réaliser où sont les problèmes. 


Remarque 6.5 C'est la présence de modèles “parasites”, i.e. d’autres modèles que 
ceux que l’on arrive à décrire et que l’on ne peut pas éviter, qui sera quelque part au 
cœur des difficultés de l’axiomatisation des entiers. 


6.1.3 Égalité 


Attention, la discussion précédente est impropre : on a utilisé à plusieurs reprises 
le symbole d'égalité. La discussion suppose que l’interprétation de l’égalité est bien 
l'égalité. 


Exemple 6.4 En fait 


est bien un modèle de (6.2). et donc il est parfaitement faux que caractérise les 
triangles. 

En effet, appelons {a, b, c, d} les sommets de haut en bas et de gauche à droite ; on 
peut considérer l'interprétation = de = aveca=a,b=b,c=cd=betaÆ£b,a 
c,b £ c. Un tel modèle vérifie bien (6.2). Cependant, =, l'interprétation de = n’est pas 
l'égalité. Remarquons que l’on a une arête entre a et b, b = d qui est vrai mais pas 
d’arête entre a et d. 
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Il faut pour rendre correct la discussion ajouter d’une part le symbole = à la signa- 
ture dans les exemples, et d’autre part, ajouter les axiomes vérifiés par l’égalité. 

Soit À un ensemble de symboles de relations contenant au moins le symbole d’éga- 
lité =. 


Définition 6.3 (Axiomes de l’égalité) Les axiomes de l'égalité pour une signature Y = 
(C,F,R), avec =E R, sont 

— l’axiome Vx x = x 

— pour chaque symbole de fonction f € F d’arité n, l’axiome 


Væ: z - Va;Vr! Var, (td — œ A f(æ:,: LT æ5) ne f(æ:,- 4 503583 : ,Tn)) 
— pour chaque symbole de relation R ER d’arité n, 
Vase VaiVal Vars = 24 = (Ra, die tn) = Rai, me: ,&n)) 


Tous ces axiomes spécifient que l’égalité est reflexive et est préservée par par les 
symboles de fonction et de relation. 
Exercice 6.1. Prouver que l’on a nécessairement alors Va Wy (x = y = y = x). 


Exercice 6.2.  Prouver que l’on a nécessairement alors pour chaque symbole de re- 
lation R ER d'’arité n, 


Vase VaiVal Vars = 2 = (Ra, ti, tn) & Ra, ah ,æn)). 
Exercice 6.3. Prouver que l’on a nécessairement alors pour chaque formule F(x1,x%2,...,7») 
Van VaiVel-. Van(ai = 2 = (Fa, mice: ,œn) © Fæ,-:: ,x,-.. ,æn)). 


Exercice 6.4.  Prouver que l’on a nécessairement alors Va WyWz ((x = yAy = 2) = 
x = 2). 

On déduit des deux exercices précédents, que — (et son interprétation) est une re- 
lation d’équivalence. 


6.1.4 Petite parenthèse 


Définition 6.4 Un modèle M d’une théorie T sur une signature avec le symbole de 
relation = est dit égalitaire, si l’interprétation de = dans M est l'égalité. 


En d’autres termes, l’interprétation du symbole — dans M est le sous-ensemble 
{(x,x)|x € M} où M est l’ensemble de base de M. 

Il se trouve que si ce n’est pas le cas, et si les axiomes de l’égalité font partie de la 
théorie T, alors on peut s’y ramener : 
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Proposition 6.1 Soit T une théorie sur une signature Y, avec au moins le symbole — 
comme symbole de relation, qui contient tous les axiomes de l'égalité pour Y. 


SiT possède un modèle, alors T possède un modèle égalitaire. 


Démonstration: On peut quotienter le domaine M de tout modèle M de 7 par la 
relation d’équivalence qui place dans la même classe d’équivalence x et y lorsque 
l'interprétation de x — y est vraie dans M (1.e. l'interprétation de =). Le modèle 
quotient, c’est-à-dire celui dont les éléments sont les classes d'équivalence de cette 
relation d’équivalence, est par définition égalitaire. 


Du coup, une théorie 7 possède un modèle égalitaire si et seulement si tous les 
axiomes de l’égalité (pour la signature correspondante) possèdent un modèle. 


Exemple 6.5 Dans ! ’exemple|6.3] la phrase devrait être : les modèles égalitaires de la 
formule caractérisent les triangles. 


Ou encore : la formule (6.2) avec les axiomes de l'égalité (dans ce cas Vxx — 
w,VaVr Vy(r = 2 = (R(x,y) = R(x’,y))), VaVWy'(y = y = (R(x,y) = 
R(x,y'))))) caractérise les triangles. 


6.1.5 Groupes 


Commençons par parler des groupes, en théorie des groupes. 


Exemple 6.6 (Groupe) Un groupe est un modèle de la théorie constituée des axiomes 
de l’égalité et des deux formules : 


VaVyVz à x (y x 2) = (x x y) x 2 (6.3) 
JeVr (xxe—exx =rATIy(rxy—=yxx—e)) (6.4) 


sur la signature À = (Ÿ,{+},{=}), où x et = sont d’arité 2. 


La première propriété exprime le fait que la loi du groupe * est associative, et la 
seconde qu’il existe un élément neutre, e, tel que tout élément possède un inverse. 


Exemple 6.7 (Groupe commutatif) Un groupe commutatif est un modèle de la théo- 
rie constituée des axiomes de l'égalité et des trois formules : 


Va à x (y x 2) = (x x y) x 2 (6.5) 
deVr (rxe—=exxz =xATy(xxy=yxx—=e)) (6.6) 
VaNVYy TXkY=YXxX (6.7) 


sur la même signature. 
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6.1.6 Corps 


Exemple 6.8 (Corps commutatif) Un corps commutatif est un modèle de la théorie 
constituée des axiomes de l’égalité et des formules 


VaVyVz (x + (y +2) = (x + y) +2) (6.8) 
VaWy(x +y=y+x) (6.9) 

Va(x +0 = x) (6.10) 

VxZy(x + y = 0) (6.11) 

VaViNz x x(y+z)=xxy+xrxz (6.12) 
VaVyVz ((x x y) x 2) = (xx (yxz)) (6.13) 
VaVy (x xy—=yxx) (6.14) 

Vx (xx1=x) (6.15) 

Vady(x = 0Vxxy=1) (6.16) 

ES (6.17) 


sur une signature avec deux symboles de constantes O et 1, deux symboles de fonctions 
+ et *x d’arité 2, et le symbole de relation = d’arité 2. 


Par exemple R ou € avec l'interprétation standard sont des modèles de ces théories. 

Si l’on ajoute à la théorie la formule F, définie par 1 +--:+1 — 0, où 1 est répété 
p fois, les modèles sont les corps de caractéristique p : par exemple Z,,, lorsque p est 
premier. 

Si l’on veut décrire un corps de caractéristique nulle, il faut considérer la théorie 
constituée des axiomes précédents et de l’union des axiomes F,, pour p un nombre 
premier. 


Exemple 6.9 (Corps algébriquement clos) Pour chaque entier n, on considère la for- 
mule G} 


VaoVai - :: Vln_117(20 + T1 *T+toka? +. tan ka txt) —0 
où le lecteur aura deviné que x" est x x - -- x x avec x répété k fois. 

Un corps commutatif algébriquement clos est un modèle de la théorie constituée 
des axiomes des corps commutatifs et de l’union des formules G, pour n € N. 


Par exemple, C est algébriquement clos. R n’est pas algébriquement clos, car x?+1 
ne possède pas de racine réelle. 
6.1.7 Arithmétique de Robinson 


On peut aussi chercher à axiomatiser les entiers. Voici une première tentative. 


Exemple 6.10 (Arithmétique de Robinson) Considérons la signature constituée du 
symbole de constante 0, d’une fonction unaire s, et de deux fonctions binaires + et *, 
et des relations binaires < et —. 
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Les axiomes de l’arithmétique de Robinson sont les axiomes de l’égalité et 


Væx —s(x) = 0 (6.18) 

Va Vy (s(x) = s(y) = x = y) (6.19) 
Va (x = OV y sy) = x) (6.20) 
VxO+x=x (6.21) 

Væ s(x) + y = s(x +y) (6.22) 
VxO+xx—0 (6.23) 

Var S(t)*y=T*xy+Yy (6.24) 
(6.25) 


La structure dont l’ensemble de base est les entiers, et où l’on interprète + par 
l'addition, * par la multiplication, et s(x) par x + 1 est un modèle de cette théorie. On 
appelle ce modèle le modèle standard des entiers. 

Remarquons que l’on peut définir dans tout modèle des axiomes précédents un 
ordre, par la règle x < y ssi 2 (x + 5(2) = y). 

Une alternative est de prendre < comme primitif et d’ajouter les axiomes 


Vx —x < 0 (6.26) 

VzxO=xVO<r (6.27) 

Va Vy (x <ye (s(x) < y V s(x) = y)) (6.28) 
Va Vy (x < s(y) & (x < y V x = y)) (6.29) 


Exercice 6.5.  Prouver que l’ordre défini par la règle x < y ssi 22 (x + s(z) = y) 
satisfait ces formules. 


Exercice 6.6. Soit n et m deux entiers. On note s"(0) pour s(s(-:-s(0))) avec s 
répété n fois, avec la convention 50) — 0. 
Montrer par récurrence que 


s"(0) + s”(0) = s"*”(0). 


Trouver un modèle des axiomes de Robinson où deux éléments a et b sont tels que 
a+b£b+a. 

En déduire que les axiomes de Robinson ne suffisent pas à axiomatiser les entiers : 
il y a d’autres modèles que le modèle standard des entiers de ces axiomes. 


Exercice 6.7. Ajoutons VxVy(x + y = y + x) aux axiomes précédents pour garantir 
la commutativité de l'addition. Produire un modèle des axiomes obtenus qui n’est pas 
le modèle standard des entiers : par exemple, avec deux éléments a et btels que axb % 
b x a. 


Plutôt que de chercher à ajouter certains axiomes pour garantir des propriétés comme 
la commutativité de l’addition ou la multiplication, on va considérer des familles d’axiomes. 
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6.1.8 Arithmétique de Peano 


Exemple 6.11 (Arithmétique de Peano) Considérons une signature constituée du sym- 
bole de constante 0, d’une fonction unaire s, et de deux fonctions binaires + et =x, et de 
la relation binaire =. 

Les axiomes de l’arithmétique de Peano sont les axiomes de l'égalité et 


Væx —s(x) = 0 (6.30) 

VaVy (s(x) = s(y) = x = y) (6.31) 
Va (x = 0 V y s(y) = x) (6.32) 
VrxO0+x=x (6.33) 

Va s(x) + y = s(x + y) (6.34) 

Vrz Oxx=—0 (6.35) 

Va s(x)*y=Txy+y (6.36) 
(6.37) 


et l’ensemble de toutes les formules de la forme 


Vas -Vrn((F(0,1,--- ,&n) A Vro(F(to, t1,-:- ,2n) = F(s(xo), 21, °-: ,Zn))) 


= VroF (to, T1,::: ,Tn)) (6.38) 


où n est n'importe quel entier et F(xo,::: ,x,) est n'importe quelle formule de va- 
riables libres xo,:°* , Ty. 


Il y a donc en fait une infinité d’axiomes. Les derniers axiomes visent à capturer le 
raisonnement par récurrence que l’on fait régulièrement sur les entiers. 

Bien entendu, ces axiomes garantissent la propriété suivante : le modèle standard 
des entiers est un modèle de ces axiomes. 


Exercice 6.8.  Prouver que l’axiome Vx (x = 0 V y s(y) = x) est en fait inutile : 
cette formule est conséquence des autres. 


Un intérêt est que cette fois on a : 


Exercice 6.9.  Prouver que dans tout modèle des axiomes de Peano, l’addition est 
commutative : la formule VaWy(x + y = y + x) est satisfaite. 


Exercice 6.10. Prouver que dans tout modèle des axiomes de Peano, la multiplication 
est commutative : la formule VxVy(x x y = y *x x) est satisfaite. 


Autrement dit, ces familles d’axiomes suffisent à garantir nombre des propriétés 
qui sont vraies sur les entiers. 

On verra ultérieurement (théorème d’incomplétude) qu’il y reste cependant d’autres 
modèles que le modèle standard des entiers des axiomes de Peano. 
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6.2 Complétude 


Le théorème de complétude, dû à Kurt Güdel, et parfois appelé premier théorème 
de Güdel, relie la notion de conséquence à la notion de prouvabilité, en montrant que 
ces deux notions coïncident. 


6.2.1 Conséquence 


La notion de conséquence est facile à définir. 


Définition 6.5 (Conséquence) Soit F une formule. La formule F est dite une consé- 
quence (sémantique) de la théorie T si tout modèle de la théorie T est un modèle de 
F. On note dans ce cas T = F. 


Exemple 6.12 Par exemple, la formule VaVy x * y = y * x, qui exprime la commuta- 
tivité, n’est pas une conséquence de la théorie des groupes (définition (6.6), car il ya 
des groupes qui ne sont pas commutatifs. 


Exemple 6.13 On peut montrer que la formule Vx 0 + x = x est une conséquence des 
axiomes de Peano. 


Exemple 6.14 L'exercice 6.6. prouve que la formule Va Wy(x + y = y + x) (commu- 
tativité de l'addition) n’est pas une conséquence des axiomes de Robinson. 


6.2.2 Démonstration 


Il faut aussi fixer la notion de démonstration, ce que nous allons faire, mais disons 
dans un premier temps que nous avons une notion de démonstration telle que l’on note 
TH F'si l’on peut prouver la formule close F à partir des axiomes de la théorie 7. 

On espère au minimum de cette notion de preuve d’être valide : c’est-à-dire de 
dériver uniquement des conséquences : si F est une formule close, et si T + F, alors 
F' est une conséquence de 7. 


6.2.3 Énoncé du théorème de complétude 


Le théorème de complétude dit en fait qu’on arrive à atteindre toutes les consé- 
quences : les relations = et + sont les mêmes. 


Théorème 6.1 (Théorème de complétude) Soit T une théorie. Soit F une formule 
close. F est une conséquence de T si et seulement si F se prouve à partir de T. 


6.2.4 Signification de ce théorème 


Arrêtons-nous sur ce que cela signifie : autrement dit, les énoncés prouvables sont 
exactement ceux qui sont vrais dans tous les modèles de la théorie. 
Cela signifie en particulier que 
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— si une formule close F' n’est pas prouvable alors c’est qu’il existe un modèle qui 
n’est pas un modèle de F. 

— siune formule close Fest vraie dans tous les modèles des axiomes de la théorie, 
alors Fest prouvable. 


Exemple 6.15 Par exemple, la formule VaVy x * y = y * x, qui exprime la commuta- 
tivité, n’est pas prouvable à partir des axiomes de la théorie des groupes. 


Exemple 6.16 La formule Vx O + x = x est prouvable à partir des axiomes de Peano. 


6.2.5 Autre formulation du théorème 


On dit qu’une théorie 7 est cohérente s’il n’existe pas de formule F telle que 
THFeTH-rF. 
On verra au détour de la preuve que cela revient aussi à dire : 


Théorème 6.2 (Théorème de complétude) Soit T une théorie. T possède un modèle 
si et seulement si T est cohérente. 


6.3 Preuve du théorème de complétude 


6.3.1 Un système de déduction 


Il nous faut définir une notion de démonstration. Nous choisissons de considérer 
une notion basée sur la notion de preuve à la Frege et Hilbert, c’est-à-dire basée sur le 
modus ponens. 

Par rapport au calcul propositionnel, on n’utilise plus seulement la règle de modus 
ponens, mais aussi une règle de généralisation : si F est une formule et x une variable, 
la règle de généralisation déduit VxF de F. 

Cette règle peut être considérée comme troublante, mais c’est ce que l’on fait dans 
le raisonnement courant régulièrement : si on arrive à prouver F(x) sans hypothèse 
particulière sur x, alors on saura que VxF(x). 

On considère alors un certain nombre d’axiomes : 


Définition 6.6 (Axiomes logiques du calcul des prédicats) Les axiomes logiques du 
calcul des prédicats sont : 


1. toutes les instances des tautologies du calcul propositionnel ; 


2. les axiomes des quantificateurs, c’est-à-dire 


(a) les formules de la forme (3xF & —-Vx-F), où F est une formule quel- 
conque et x une variable quelconque ; 


(b) les formules de la forme (Vx(F = G) = (F = VxG)) où F et G sont 
des formules quelconques et x une variable qui n’a pas d’occurrence libre 
dans F'; 
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(c) les formules de la forme (VxF = F(t/x)) où F est une formule, t un terme 
et aucune occurrence libre de x dans F ne se trouve dans le champ d’un 
quantificateur liant une variable de t, où F(t/x) désigne la substitution de 
x part. 


Exercice 6.11. Montrer que les axiomes logiques sont valides. 


Remarque 6.6 On pourrait ne pas mettre toutes les tautologies du calcul proposition- 
nel, et comme pour le calcul propositionnel se limiter à certains axiomes, essentiel- 
lement les axiomes de la logique booléenne. Nous le faisons ici pour simplifier les 
preuves. 


On obtient la notion de démonstration. 


Définition 6.7 (Démonstration par modus ponens et généralisation) Soit T une théo- 
rie et F une formule. Une preuve de F'à partir de T est une suite finie F1, F2,--- ,Fy 
de formules telle que F, est égale à F, et pour tout i, ou bien F; est dans T, ou bien 
F; est un axiome logique, ou bien F; s'obtient par modus ponens à partir de deux for- 
mules F';,F, avec j <'iet k < i, ou bien F; s'obtient à partir d’un formule F; avec 
j < à par généralisation. 


On note 7 H F'si Fest prouvable à partir de 7. 


6.3.2 Théorème de finitude 


On obtient d’abord facilement au passage le théorème de finitude. 


Théorème 6.3 (Théorème de finitude) Pour toute théorie T, et pour toute formule 
F, siT HF, alors il existe un sous-ensemble fini To de T tel que To F. 


Démonstration: Une démonstration est une suite finie de formules F1, F2, +. , Fn. 
Elle ne fait donc appel qu’à un nombre fini 7 de formules de 7. Cette démonstration 
est aussi une démonstration de F dans la théorie T5. 


Corollaire 6.1 SiT est une théorie dont toutes les parties finies sont cohérentes, alors 
T est cohérente. 


Démonstration: Sinon 7 prouve (F A -F), pour une certaine formule F, et par 
le théorème de finitude on en déduit qu’il existe un sous-ensemble fini 79 de 7 qui 
prouve aussi (FA —F). 


6.3.3 Deux résultats techniques 


On aura besoin des deux résultats suivants, dont les démonstrations relèvent d’un 
jeu de réécriture sur les démonstrations. 


Lemme 6.1 (Lemme de déduction) Supposons que T Ü {F} + G, avec F une for- 
mule close. Alors TE (F = QG). 
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Démonstration: A partir d’une démonstration GoG - : - G de G dans TU {F} 
on construit une démonstration de (F = G) dans 7 en faisant des insertions dans la 
suite (F = Go)(F = Gi)-..(F = Gh). 

Si G; est une tautologie, alors il n’y a rien à faire car (F = G;) en est une aussi. 

Si G; est F, alors il n’y a rien à faire car (F = G) est une tautologie. 

Si G; est un axiome des quantificateurs ou encore un élément de 7, alors il suffit 
d’insérerf [entre (F = Gi-1)et (F = Gi) les formules G; et (G; = (F = G;)) (qui 
est une tautologie). 

Supposons maintenant que G; soit obtenue par modus ponens : il y a des entiers 
j,k < i tels que G% soit (G; = G;). On insère alors entre (F = G;_:)et (F = G;) 
les formules ; 

L((F-=G;)=((F = (G; = G;)) = (F = G;))) (une tautologie); 

2. (F = (G; = Gi)) = (F = Gi)) qui s’obtient par modus ponens à partir de la 

précédente à l’aide de (F = G;) qui est déjà apparue ; 


3. (F = G;) se déduit alors par modus ponens de cette dernière formule et de 
(F = (G; = G)), qui est déjà apparue puisque c’est (F = G%). 
Supposons enfin que G; soit obtenue par généralisation à partir de G'; avec j < i. 
On insère dans ce cas entre (F = G;_1)et (F = G;) les formules : 
1. Vr(F = G';) obtenue par généralisation en partant de (F = G;); 


2. (Va(F = G;) = (F = VxG;)) (un axiome des quantificateurs). F étant une 
formule close, x n’y est pas libre ; 


3. (F = G;) se déduit alors par modus ponens à partir des deux précédentes. 


Lemme 6.2 Soit T une théorie, et F(x) une formule dont la seule variable libre est x 
. Soit c un symbole de constante qui n'apparaît ni dans F' ni dans T. SiT + F(c/x) 
alors T + VxF (x). 


Démonstration: Considérons une démonstration F1 F2 --. F, de F(c/x) dans T. 
On considère une variable w qui n’est dans aucune formule F; et on appelle K; la 
formule obtenue en remplaçant dans F; le symbole c par w. 

Il s’avère que cela donne une preuve de F(w/x) : si F; est un axiome logique, K; 
aussi ; si F; se déduit par modus ponens, alors K; se déduit des mêmes formules, et si 
F; € T alors K,; est F:. 

Par généralisation, on obtient donc une preuve de VwF(w/x), et par la remarque 
qui suit, on peut alors obtenir une preuve de VxF(x). 


Remarque 6.7 Si w est une variable qui n’a aucune occurence dans F' (ni libre ni 
liée) alors on peut prouver VwF(w/x) = VxF : en effet, puisque w n’a pas d’occu- 
rence dans F, on peut donc prouver VwF(w/x) = F, (axiome (c) des quantificateurs, 
en observant que (F(w/x))(x/w) = F avec ces hypothèses). Par généralisation, on 
obtient Vx(VwF(w/x) = F), et puisque x n’est pas libre dans VwF(w/x), la for- 
mule Vx(VwF(w/x) = F) = (VwF(w/x) = VxF) fait partie des axiomes (b) des 
quantificateurs, ce qui permet d'obtenir VwF(w/x) = VxF par modus ponens. 


1. Pour à = O0, il suffit de placer ces formules au début. 
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6.3.4 Validité du système de déduction 


La validité de la méthode de preuve utilisée est facile à établir. 


Théorème 6.4 (Validité) Soit T une théorie. Soit F une formule. 
SiT + F, alors tout modèle de T est un modèle de la clôture universelle de F. 


Démonstration: Il suffit de se convaincre que les axiomes logiques sont valides, et 
que le modus ponens et la généralisation ne font qu’inférer des faits qui sont valides 
dans tout modèle de 7. 

C’était le sens facile du théorème de complétude. 


6.3.5 Complétude du système de déduction 


L'autre sens consiste à montrer que si F° est une conséquence de 7 alors F peut se 
prouver par notre méthode de preuve. 


Définition 6.8 


On dit qu'une théorie T est complète si pour toute formule close F on aT + Fou 
T+-F. 


On dit qu'une théorie T admet des témoins de Henkin si pour toute formule F(x) 
avec une variable libre x, il existe un symbole de constante c dans la signature tel que 
(3xF(x) = F(c)) soit une formule de la théorie T. 


Le preuve du théorème de complétude due à Henkin que nous présentons ici fonc- 
tionne en deux étapes. 


1. On montre qu’une théorie cohérente, complète, et avec des témoins de Henkin 
admet un modèle. 


2. On montre que toute théorie consistante admet une extension avec ces trois pro- 
priétés. 


Lemme 6.3 Si T est une théorie cohérente, complète, et avec des témoins de Henkin, 
alors T possède un modèle. 


Démonstration: L’astuce est de construire de toutes pièces un modèle, dont l’en- 
semble de base (le domaine) est l’ensemble 17 des termes clos sur la signature de la 
théorie : ce domaine n’est pas vide, car la signature a au moins les constantes. 

La structure M est définie de la façon suivante : 


1. si cest une constante, l'interprétation c? de c est la constante c elle-même. 


2. si f est un symbole de fonction d’arité n, son interprétation f”* est la fonction 
qui aux termes clos t1,--- ,t, associe le terme clos f(t1,--- ,t»). 


3. si À est un symbole de relation d’arité n, son interprétation R° est le sous- 
ensemble de M” constitué des (t1,--: ,t,) tels que 7 H R(t1,--- ,tn). 
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On observe que la structure obtenue vérifie la propriété suivante : pour toute for- 
mule close F, T + F si et seulement si 9 est un modèle de F. Cela se prouve par 
induction structurelle sur F. 

La propriété est vraie pour les formules atomiques. 

En raison des propriétés des quantificateurs et connecteurs, et de la possibilité d’uti- 
liser des occurrences des tautologies du calcul propositionnel dans notre méthode de 
preuve, il suffit de se convaincre de ce fait inductivement sur les formules du type -G, 
(GV H) et VrG. 


1. Cas -G : puisque 7 est complète, T + -G si et seulement si 7 H G, ce qui 
signifie inductivement M £ G, ou encore MN = -G. 

2. Cas (G V H) : supposons M EH (G V H), et donc M EH G ou M = H. 
Dans le premier cas par exemple, par hypothèse d’induction on a 7 + G, et 
puisque (G = (GV H)) est une tautologie, on a T + (GV H). Réciproquement 
supposons que 7 + (GV H).SiT H G'alors par hypothèse d’induction M = G 
et donc Mt EH (G V H). Sinon, c’est que 7 | G, et parce que la théorie est 
complète, on a 7 + -G. Or puisque (G V H = (-G = H)) est une tautologie, 
on obtient que 7 + H et par hypothèse d’induction, M = H et donc M 
(GV H). 

3. Cas 2rG{(x) : si M = rG(x) c’est qu'il existe un terme clos { tel que M 
G(t/x). Par hypothèse d’induction, T + G{t/x). Or il est facile de trouver une 
démonstration formelle de 3xG{(x) à partir d’une de G(t/x). Réciproquement, 
supposons que 7 + xG(x). Grâce aux témoins de Henkin, on en déduit qu’il 
existe une constante c telle que T + G{c/x), et par hypothèse d’induction M = 
G(c/x), et donc M = 3xG (x). 


Il reste la seconde étape. Une extension d’une théorie T est une théorie 7” qui 
contient 7. 


Proposition 6.2 Toute théorie cohérente T sur une signature Y possède une extension 
T' sur une signature 37 (avec Y qui contient Ÿ) qui est cohérente, complète et avec 
des témoins de Henkin. 


Avant de prouver cette proposition, discutons de ce que nous obtenons : puisqu’un 
modèle de 7” est un modèle de 7, le lemme précédent et la proposition précédente 
permettent tout d’abord d’obtenir : 


Corollaire 6.2 Une théorie cohérente possède un modèle. 
La remarque suivante relève d’un jeu sur les définitions : 


Proposition 6.3 Pour toute théorie T et pour toute formule close F, F est une consé- 
quence de T si et seulement si T U {-F} n'a pas de modèle. 


Démonstration: Si F est une conséquence de T, alors par définition tout modèle de 
Test un modèle de F, autrement dit, il n’y pas de modèle de 7 U{-F}. La réciproque 
est triviale. 

On obtient avec cette remarque exactement le théorème de complétude (ou le sens 
manquant de ce que nous avons appelé le théorème de complétude). 
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Théorème 6.5 Soit F une formule close. Si F est une conséquence de la théorie T, 
alorsTtF. 


Démonstration: Si 7 ne prouve pas F, alors 7 U {-F} est cohérente : par le 
corollaire précédente, 7 U {—F} possède donc un modèle. Cela veut donc dire que F 
n’est pas une conséquence de la théorie 7. 

Il ne reste plus qu’à prouver la proposition [6.2] 

Démonstration: La signature > est obtenue en ajoutant un nombre dénombrable 
de nouvelles constantes à la signature Y. La signature Y/ obtenue reste dénombrable et 
on peut énumérer les formules closes (F, )1en de 2”. La théorie 7” est obtenue comme 
l’union d’une suite croissante de théories 7,,, définie par récurrence, en partant de 75 = 
T. Supposons 7, cohérente construite. Pour construire 7,41 on considère la formule 
F1 dans l’énumération des formules closes de Y. Si 7, U F, 11 est cohérente, alors 
on pose Gn = Fh+1, sinon on pose G, — -F,+1. Dans les deux cas 7, U {G,} est 
cohérente. 

La théorie 7, :1 est définie par : 


1. Tni1 = Tn U {Ga} si G, n’est pas de la forme 2H. 


2. sinon : 7n31 = 7n U {Gn, H(c/x)} où c est un nouveau symbole de constante 
qui n’apparaît dans aucune formule de T,}U{G, } : il y a toujours un tel symbole, 
car il y a un nombre fini de symboles de constantes dans T} U {Gh}. 


La théorie 7,1 est cohérente : en effet, si elle ne l’était pas, alors cela voudrait 
dire que G, serait de la forme 2x7, et que T, U {3xH}+ -H(c/x). Par le choix de 
la constante c, et par le lemme|6.2] on obtient que Th U {27H} + Vxr-H(x), ce qui est 
impossible car sinon 7, ne serait pas cohérente. 

La théorie T' — LE EN T, définie comme l’union des théories 7,, est cohérente, 
puisque tout sous-ensemble fini de celle-ci est contenu dans l’une des théories 7,, et 
donc est cohérent. 

La théorie 7” est aussi complète : si F est une formule close de >, elle apparaît à 
un moment dans l’énumération des formules F,, et par construction, soit F, € T,, soit 
no 07 

Enfin la théorie 7” a des témoins de Henkin : si H(x) est une formule avec la 
variable libre x, alors la formule 37H apparaît comme une formule dans l’énumération 
des formules F,. Il y a alors deux cas, soit -F, € Th+1 où il y a une constante c telle 
que H(c/x) € T1. Dans les deux cas, 7h41 + AxH(x) = H(c/x), ce qui prouve 
que (AxH(x) = F(c)) est dans 7” (sinon sa négation y serait, et 7” ne serait pas 
cohérente). 


6.4 Compacité 


Observons que l’on a fait établi d’autres faits. 


Théorème 6.6 (Théorème de compacité) Soit T une théorie telle que toute partie fi- 
nie de T possède un modèle. Alors T possède un modèle. 
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Démonstration: Considérons un sous-ensemble fini d’une telle théorie 7. Ce sous- 
ensemble est cohérent puisqu'il a un modèle. T est donc une théorie telle que toute 
partie finie soit cohérente. Par le théorème de finitude, cela veut dire que la théorie 
elle-même est cohérente. 

Par le corollaire cela veut dire que 7 possède un modèle. 


Exercice 6.12. Utiliser le théorème de compacité pour prouver qu'il existe des mo- 
dèles (non-standards) des axiomes de Peano. 

6.5 Autres conséquences 

Théorème 6.7 (Lüwenheim-Skolem) SiT une théorie sur une signature dénombrable 


possède un modèle, alors elle possède un modèle dont l’ensemble de base est dénom- 
brable. 


Exercice 6.13. Prouver le théorème. 


6.6 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de [Cori and Lascar, 1993a], [Dowek, 2008] et [Lassaigne and de Rougemont, 20041. 


Bibliographie Ce chapitre a été rédigé en s’inspirant essentiellement des ouvrages 


|Cori and Lascar, 1993al] et [Lassaigne and de Rougemont, 20041. 


Chapitre 7 


Modèles de calculs 


Nous avons utilisé jusque-là à de multiples reprises la notion d’algorithme, sans en 
avoir donné une définition formelle. Intuitivement, on peut se dire qu’un algorithme 
est une méthode automatique, qui peut s’implémenter par un programme informatique, 
pour résoudre un problème donné. 

Par exemple, la technique familière pour réaliser une addition, une multiplication, 
ou une division sur des nombres enseignée à l’école primaire correspond à un algo- 
rithme. Les techniques discutées pour évaluer la valeur de vérité d’une formule pro- 
positionnelle à partir de la valeur de ses propositions sont aussi des algorithmes. Plus 
généralement, nous avons décrit des méthodes de démonstration pour le calcul propo- 
sitionnel ou le calcul des prédicats qui peuvent se voir comme des algorithmes. 


Exemple 7.1 L'exemple suivant est repris du manuel du paquetage TikZ-PGF version 
2.0, lui-même inspiré des Éléments d’Euclide. 


Algorithme: 
Pour construire un triangle équilatéral 
ayant pour coté AB: tracer le cercle de 
C.— centre À de rayon AB; tracer le cercle 
de centre B de rayon AB. Nommer C 
l’une des intersections de ces deux cer- 
| B \E cles. Le triangle ABC est la solution 
| recherchée. 


Nous allons voir dans les chapitres suivants que tous les problèmes ne peuvent pas 
être résolus par algorithme, et ce même pour des problèmes très simples à formuler : 
par exemple, 

— il n’y a pas d’algorithme pour déterminer si une formule close du calcul des 

prédicats est valide dans le cas général ; 
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ruban 


FIGURE 7.1 —- Machine de Turing. La machine est sur l’état initial d’un calcul sur le 
mot abaab. 


— iln’y a pas d’algorithme pour déterminer si un polynôme multivarié (à plusieurs 
variables) à coefficients entiers possède une racine entière (10ème problème de 
Hilbert). 

Historiquement, c’est en fait la formalisation de ce que l’on appelle une démonstra- 
tion, et des limites des systèmes de preuve formelle qui a mené aux modèles que l’on 
va discuter. On a ultérieurement compris que la notion capturée par ces modèles était 
beaucoup plus large que simplement la formalisation de la notion de démonstration, et 
couvrait en réalité une formalisation de tout ce qui est calculable par dispositif infor- 
matique digital. Cela reste d’actualité, puisque les ordinateurs actuels sont digitaux. 

Par ailleurs, plusieurs formalisations ont été proposées de ces notions de façon 
indépendante, en utilisant des notions à priori très différentes : en particulier par Alonzo 
Church en 1936, à l’aide du formalisme du À-calcul, par Turing en 1936, à l’aide de 
ce que l’on appelle les machines de Turing, ou par Post en 1936, à l’aide de systèmes 
de règles très simples, appelés systèmes de Post. Par la suite, on s’est convaincu que de 
nombreux formalismes étaient équivalents à tous ces modèles. 

L'objet de ce chapitre est de définir quelques modèles de calculs et de montrer 
qu’ils sont équivalents à celui de la machine de Turing. Nous finirons en évoquant ce 
que l’on appelle la thèse de Church-Turing. 

Les modèles que l’on va décrire peuvent être considérés comme très abstraits, mais 
aussi et surtout très limités et loin de couvrir tout ce que l’on peut programmer avec 
les langages de programmation évolués actuels comme CAML ou JAVA. Tout l’objet 
du chapitre est de se convaincre qu’il n’en est rien : tout ce qui programmable est 
programmable dans ces modèles. 


7.1 Machines de Turing 


7.1.1 Ingrédients 


Une machine de Turing (déterministe) (voir la figure est composée des élé- 
ments suivants : 


1. Une mémoire infinie sous forme de ruban. Le ruban est divisé en cases. Chaque 
case peut contenir un élément d’un ensemble X (qui se veut un alphabet). On 
suppose que l’alphabet Y est un ensemble fini. 
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2. une tête de lecture : la tête de lecture se déplace sur le ruban. 


3. Un programme donné par une fonction de transition qui pour chaque état de la 
machine q, parmi un nombre fini d’états possibles Q, précise selon le symbole 
sous la tête de lecture : 

(a) l’état suivant g € Q; 

(b) le nouvel élément de Y à écrire à la place de l’élément de Y sous la tête de 
lecture ; 

(c) un sens de déplacement pour la tête de lecture. 

L’exécution d’une machine de Turing sur un mot w € Y* peut alors se décrire 
comme suit : initialement, l’entrée se trouve sur le ruban, et la tête de lecture est posi- 
tionnée sur la première lettre du mot. Les cases des rubans qui ne correspondent pas à 
l’entrée contiennent toutes l’élément B (symbole de blanc), qui est un élément parti- 
culier de Y. La machine est positionnée dans son état initial qo : Voir la figure[7.1] 

A chaque étape de l’exécution, la machine, selon son état, lit le symbole se trouvant 
sous la tête de lecture, et selon ce symbole, elle 

— remplace le symbole sous la tête de lecture par celui précisé par sa fonction 
transition ; 

— déplace (ou non) cette tête de lecture d’une case vers la droite ou vers la gauche 
suivant le sens précisé par la fonction de transition ; 

— change d’état vers l’état suivant. 

Le mot w est dit accepté lorsque l’exécution de la machine finit par atteindre l’état 

d’acceptation. 


7.1.2 Description 


La notion de machine de Turing se formalise de la façon suivante : 


Définition 7.1 (Machine de Turing) Une machine de Turing est un 8-uplet 


M — (Q, >,7, B, 6, 40; Ga Qr) 


Q est l’ensemble fini des états ; 

Z est un alphabet fini ; 

l'est l’alphabet de travail fin: 2 CT; 
B ET est le caractère blanc ; 

do € Q est l’état initial ; 

Ga € Q est l’état d'acceptation ; 

gr € Q est l’état de refus (ou d'arrêt) ; 


SD NN OS HR © D 


Ô est la fonction de transition : Ô est une fonction (possiblement partielle) de 
Q XxT dans Q XT x {#.,|,—}. Le symbole + est utilisé pour signifier un 
déplacement vers la gauche, 
droite. 


aucun déplacement, — un déplacement vers la 
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Le langage accepté par une machine de Turing se définit à l’aide des notions de 
configurations et de la relation successeur entre configurations d’une machine de Tu- 
ring. Une configuration correspond à toute l’information nécessaire pour décrire l’état 
de la machine à un instant donné, et pouvoir déterminer les états ultérieurs de la ma- 
chine. A savoir : 

— l’état; 

— le contenu du ruban; 

— la position de la tête de lecture. 

Plus formellement, 


Définition 7.2 (Configuration) Une configuration est donnée par la description du 
ruban, par la position de la tête de lecture/écriture, et par l’état interne. 


Pour écrire une configuration, une difficulté est que le ruban est infini : le ruban 
correspond donc à une suite infinie de symboles de l’alphabet l° de travail de la ma- 
chine. Toutefois, à tout moment d’une exécution seule une partie finie du ruban a pu 
être utilisée par la machine. En effet, initialement la machine contient un mot en entrée 
de longueur finie et fixée, et à chaque étape la machine déplace la tête de lecture au plus 
d’une seule case. Par conséquent, après { étapes, la tête de lecture a au plus parcouru t 
cases vers la droite ou vers la gauche à partir de sa position initiale. Par conséquent, le 
contenu du ruban peut à tout moment se définir par le contenu d’un préfixe fini, le reste 
ne contenant que le symbole blanc B. Pour noter la position de la tête de lecture, nous 
pourrions utiliser un entier n € Z. 

Nous allons en fait utiliser plutôt l’astuce suivante qui a le seul mérite de simplifier 
nos définitions et nos preuves ultérieures : au lieu de voir le ruban comme un préfixe 
fini, nous allons le représenter par deux préfixes finis : le contenu de ce qui est à droite 
de la tête de lecture, et le contenu de ce qui est à gauche de la tête de lecture. On écrira 
le préfixe correspondant au contenu à droite comme habituellement de gauche à droite. 
Par contre, on écrira le préfixe correspondant au contenu à gauche de la tête de lecture 
de droite à gauche : l’intérêt est que la première lettre du préfixe gauche est la case 
immédiatement à gauche de la tête de lecture. Une configuration sera donc un élément 
de Q x I* x T*. 

Formellement : 


Définition 7.3 (Notation d’une configuration) Une configuration se note C = (q,u, v), 
avec u,v € [*,qE Q :u et v désignent le contenu respectivement à gauche et à droite 
de la tête de lecture du ruban 1, la tête de lecture du ruban à étant sur la première lettre 
de v. On suppose que les dernières lettres de u et de v ne sont pas le symbole de blanc 
B. 

On fixe la convention que le mot v est écrit de gauche à droite (la lettre numéro 
i + 1 de v correspond au contenu de la case à droite de celle de numéro i) alors que le 
mot u est écrit de droite à gauche (la lettre numéro à + 1 de u correspond au contenu 
de la case à gauche de celle de numéro i, la première lettre de u étant à gauche de la 
tête de lecture). 


Exemple 7.2 La configuration de la machine représentée sur la figure[7. Iest (qo, abaab, €). 
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On notera parfois autrement les configurations : 


Définition 7.4 (Notation alternative) La configuration (q,'u,v) sera aussi vue/notée 
dans certaines sections ou chapitres comme/par uqv, en gardant u et v écrit de gauche 
à droite. 


Exemple 7.3 Une configuration comme 


se code par la configuration (q, fni,ormatique), ou parfois par in fgormatique. 


Une configuration est dite acceptante Si q = Qa, refusante Si q = qr. 
Pour w € Y*, la configuration initiale correspondante à w est la configuration 
Cluw] = (qo, €, w). 
On note : C'H C” si la configuration C” est le successeur direct de la configuration 
C' par le programme (donné par 6) de la machine de Turing. 
Formellement, si © — (q,u,v) et si a désigne la première lettrel'] de v, et si 
ô(q,a) = (g',a!,m') alors C'H C" si 
— C'=(q',u',v'),et 
— sim = |, alors u = u, et v’ est obtenu en remplaçant la première lettre a de 
v par a’; 
sim —=+-,v! = a/v, et u’ est obtenu en supprimant la première lettre de u; 
sim ——,u = au, et v’ est obtenu en supprimant la première lettre a de vw. 


Remarque 7.1 Ces règles traduisent simplement la notion de réécriture de la lettre 
a par la lettre a et le déplacement correspondant à droite ou à gauche de la tête de 
lecture. 


Définition 7.5 (Mot accepté) Un mot w € Y* est dit accepté (en temps t) par la ma- 
chine de Turing, s’il existe une suite de configurations C1,-:: ,C4 avec : 


1. Co — Cwl se 
2. Cÿk Ci pour tout i <t; 
3. aucune configuration C; pour à < t n’est acceptante ou refusante. 


4. C} est acceptante. 


Définition 7.6 (Mot refusé) Un mot w € Y* est dit refusé (en temps t) par la machine 
de Turing, s’il existe une suite de configurations C3,-:- ,C4 avec : 


1. Co — Cw] 5 


1. Avec la convention que la première lettre du mot vide est le blanc B. 
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2. Ci Ci41 pour tout i <t; 
3. aucune configuration C; pour à < t n’est acceptante ou refusante. 


4. Cy est refusante. 


Définition 7.7 (Machine qui boucle sur un mot) On dit que la machine de Turing 
boucle sur un mot w, si w n’est ni accepté, et ni refusé. 


Remarque 7.2 Chaque mot w est donc dans l’un des trois cas exclusifs suivants : 
1. ilest accepté par la machine de Turing ; 
2. il est refusé par la machine de Turing ; 


3. la machine de Turing boucle sur ce mot. 


Remarque 7.3 La terminologie boucle signifie simplement que la machine ne s'arrête 
pas sur ce mot : cela ne veut pas dire nécessairement que l’on répète à l'infini les 
mêmes instructions. La machine peut boucler pour plusieurs raisons. Par exemple, 
parce qu'elle atteint une configuration qui n’a pas de successeur défini, ou parce 
qu'elle rentre dans un comportement complexe qui produit une suite infinie de configu- 
rations ni acceptante ni refusante. 


Plus généralement, on appelle calcul de Y sur un mot w € Y*, une suite (finie ou 
infinie) de configurations (C;);en telle que Co = CÎw] et pour tout à, C; H Ci41, avec 
la convention qu’un état acceptant ou refusant n’a pas de successeur. 


Définition 7.8 (Langage accepté par une machine) Le langage L € X* accepté par 
M est l’ensemble des mots w qui sont acceptés par la machine. On le note L(M). On 
l'appelle L(M) aussi le langage reconnu par M. 


On n’aime pas en général les machines qui ne s’arrêtent pas. On cherche donc en 
général à garantir une propriété plus forte : 


Définition 7.9 (Langage décidé par une machine) On dit qu'un langage L € X* est 
décidé par Y par la machine si : 

— pour w € L, w est accepté par la machine ; 

— pour w & L (=sinon), w est refusé par la machine. 


Autrement dit, la machine accepte L et termine sur toute entrée. 
On dit dans ce cas que la machine décide L. 


7.1.3 Programmer avec des machines de Turing 


La programmation avec des machines de Turing est extrêmement bas niveau. Nous 
allons voir que l’on peut toutefois programmer réellement beaucoup de choses avec ce 
modèle. La première étape est de se convaincre que plein de problèmes simples peuvent 
se programmer. À vrai dire, la seule façon de s’en convaincre est d’essayer soit même 
de programmer avec des machines de Turing, c’est-à-dire de faire les exercices qui 
suivent. 
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Exercice 7.1. Construire une machine de Turing qui accepte exactement les mots w 
sur l’alphabet Z = {0,1} de la forme 0"1",n EN. 


Voici une solution. On considère une machine avec Q = {q0, ql, q2, q3, qd}, T = 
{0,1, X, Y, B}, l’état d'acceptation g4 et une fonction de transition 6 telle que : 


te 6(q0,Y) T (43, Y, —) ; 
— Ô(g1,0) = (qg1,0,—); 
— Ô(g1,1) = (92, Y,<+); 
— ô(q1,Y) se CRE 
— 6(q2,0) = (92,0, +); 
L 6(q2,X) Co: (g0, X,—) , 
— 6(q2,Y) _ (GK) 
= 6(q3,Y) nn (g3,Y, —); 


— 0(q3,B) = (q4,B,-). 
On le voit, décrire de cette façon une machine de Turing est particulièrement peu lisible. 
On préfère représenter le programme d’une machine (la fonction 6) sous la forme d’un 
graphe : les sommets du graphe représentent les états de la machine. On représente 
chaque transition 6(q,a) — (q',a',m) par un arc de l’état q vers l’état q” étiqueté 
par a/a’ m. L'état initial est marqué par une flèche entrante. L'état d’acceptation est 
marqué par un double cercle. 


Exemple 7.4 Par exemple, la transition 6(q0,0) = (q1, X,—) se représente graphi- 


quement par : 
on 


Selon ce principe, le programme précédent se représente donc par : 


0/0 — 
CD en 0 me 
Start — 
CE un 


Y/Y — 


Comment fonctionne ce programme : lors d’un calcul, la partie du ruban que la 
machine aura visité sera de la forme X*0*Y*1*. A chaque fois que l’on lit un 0, on 
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le remplace par un X, et on rentre dans l’état gl ce qui correspond à lancer la sous- 
procédure suivante : on se déplace à droite tant que l’on lit un O ou un Y. Dès qu’on a 
atteint un 1, on le transforme en un Ÿ, et on revient à gauche jusqu’à revenir sur un X 
(le X qu’on avait écrit) et s’être déplacé d’une case vers la droite. 

En faisant ainsi, pour chaque 0 effacé (1.e. X marqué), on aura effacé un 1 (1e. 
marqué un Ÿ). Si on a marqué tous les 0 et que l’on atteint un Ÿ, on rentre dans l’état 
q3, ce qui a pour objet de vérifier que ce qui est à droite est bien constitué uniquement 
de Y. Lorsqu'on a tout lu, i.e. atteint un B, on accepte, 1.e. on va dans l’état q4. 

Bien entendu, une vraie preuve de la correction de cet algorithme consisterait à 
montrer que si un mot est accepté, c’est que nécessairement il est du type 01”. Nous 
laissons le lecteur s’en convaincre. 


Exemple 7.5 Voici un exemple de calcul acceptant pour M : 400011 + Xq011 
XOqlit Xqg0Y1+ gX0YI1H Xqo0Y1t XXqY1t XXYqit XXqgYYH 
XgXYYE XXq4YYE XXYgY+ XXYYqg3B+t XXYY BquB. 


Définition 7.10 (Diagramme espace-temps) On représente souvent une suite de confi- 
gurations ligne par ligne : la ligne numéro à représente la ième configuration du cal- 
cul, avec le codage de la définition[7.4] Cette représentation est appelée un diagramme 
espace-temps de la machine. 


Exemple 7.6 Voici le diagramme espace-temps correspondant au calcul précédent sur 


0011. 


B|B|B|B|Dd 0 0 11 B\B|B|B|B|B|B|B|B|B|\B 
B|IB|B|BIX 4 0 1|1 B|B|B|B|B|B|B|B|B|B|\B 
B|IB|B|BIX 041 1|1 B|B|B|B|B|B|B|B|B|B \B 
B|IB|B|IBIX 2 0 Y|1 B|B|B|B|B|B|B|B|B|B | B 
B|IB|B|BIB XX 0 Y|1 B|B|B|B|B|B|B|B|B|B | B 
B|\B|B|B\X dd 0/Y 1 B|B|B|\B|B|B|B|B|B|B | B 
B|\B|B|B|X D|Y|1|/B|B|B|B|B|B|B|B|B|B | B 
B|IB|B|BIX X Y 41 B\B|B|B|B|B|B|B|B|B|\B 
B|B|B|IBIX X B\Y|Y B\B|B|B|B|B|B|B|B|B|\B 
B|B|B|BIX XX Y|Y B\B|B|B|B|B|B|B|B|B|B 
B|B|B|BIX X d\Y|Y B\B|B|B|B|B|B|B|B|B|\B 
B|IB|B|BIX X Y BY B\B|B|B|B|B|B|B|B|B|\B 
B|IB|B|IBIX X Y Y\B B|B|B|B|B|B|B|B|B|B|\B 
B|IB|IB|IBIX X Y Y B 4|B|B|B|B|B|B|B|B|B | B 


Exemple 7.7 Voici le diagramme espace-temps du calcul de la machine sur 0010 : 
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B|B|B|B|D|I00 1/0 BB B|B|B|B|B|B|B|B)B 
B|B|B|B|IX|4U|0 1/0 BB B|B|B|B|B|B|B|B)B 
B|B|B|B|IX|0|4U 1/0 BB B|B|B|B|B|B|B|B)B 
B|B|B|B|IX|&I0 Y|0 BB B|B|B|B|B|B|B|B)B 
B|IB|B|BI&|IX|0 YO BB B|B|B|B|B|B|B| BB 
B\B|B|B|X Dd|I0/Y 0 BB B\B|B|B|B|B|B|B|B 
B|IB|IB|BIX|IX|IU Y 0 BB B|B|B|B|B|B|B| BB 
B|IB|IB|BIX|IX|Y 4 0 BB B|B|B|B|B|B|B|B|B 
B|IB|IB|BIX|IX|Y O1 BB B|B|B|B|B|B|B|B|B 


Observons que sur la dernière configuration plus aucune évolution n’est possible, et 
donc il n’y a pas de calcul accepté partant de 0010. 


Exercice 7.2. {Soustraction en unaire] Construire un programme de machine de Tu- 
ring qui réalise une soustraction en unaire : partant d’un mot de la forme 0710", 
la machine s'arrête avec 0°" sur son ruban (entouré de blancs), où m © n est 
max(0,m — n). 


7.1.4 Techniques de programmation 


Voici quelques techniques utilisées couramment dans la programmation des ma- 
chines de Turing. 

La première consiste à coder une information finie dans l’état de la machine. On va 
l’illustrer sur un exemple, où l’on va stocker le premier caractère lu dans l’état. Tant 
que l’information à stocker est finie, cela reste possible. 


Exercice 7.3. Construire un programme de machine de Turing qui lit le symbole en 
face de la tête de lecture et vérifie que ce dernier n'apparaît nul part ailleurs à droite, 
sauf sur la toute dernière lettre à droite. 


Si l’on fixe un symbole ag € Y de l’alphabet », il est facile de construire un 
programme qui vérifie que le symbole ag n’apparaît nul part sauf sur la toute dernière 
lettre à droite. 


Va Æ ao, ala — 


(a) &o/ao — (a) BIB + 
Start —> 


où Va Æ ao désigne le fait que l’on doit répéter la transition a/a, — pour tout 
symbole a £ &o. 
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Maintenant pour résoudre notre problème, il suffit de lire la première lettre ao et de 
recopier ce programme autant de fois qu’il y a de lettres dans X. Si Z = {0,1,2} par 
exemple : 


Va Z 0, ala — 


Va 1, ala — BIB = 


fils 
(on) 1/1 —+ BIB + 


Va 2, ala — BIB + 


On utilise donc le fait dans cet automate que l’on travaille sur des états qui peuvent 
être des couples : ici on utilise des couples q;/3j avec à € {1,2}, et j € X. 

Une second technique consiste en l’utilisation de sous-procédures. Là encore, on 
va l’illustrer sur un exemple. 


0/0 — 


start —> 


% 


Exercice 7.4. [Multiplication en unaire] Construire un programme de machine de 
Turing qui réalise une multiplication en unaire : partant d’un mot de la forme 07107, 
la machine s'arrête avec 0"*"* sur son ruban. 


Une stratégie possible est la suivante : 
1. le ruban contiendra un mot de la forme 0*1010"" pour un certain entier k ; 


2. dans chaque étape, on change un 0 du premier groupe en un blanc, et on ajoute 
n 0 au dernier groupe, pour obtenir une chaîne de la forme 0°-110*10(*+1) ; 


3. en faisant ainsi, on copie le groupe de n 0 m fois, une fois pour chaque symbole 
du premier groupe mis à blanc. Quand il ne reste plus de blanc dans le premier 
groupe de O, il y aura donc m + n groupes dans le dernier groupe ; 


4. la dernière étape est de changer le préfixe 101 en des blancs, et cela sera ter- 
miné. 

Le cœur de la méthode est donc la sous-procédure, que l’on appellera Copy qui im- 
plémente l’étape 2 : elle transforme une configuration 0”*-*1q,0"1%- 0" en 0"-#1q$0"1#". 
Voici une façon de la programmer : si l’on part dans l’état q, avec une telle entrée, on 
se retrouve dans l’état q; avec le résultat correct. 
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0/0 — 
—. (a) 
start —>| q1l > 1/1 — 
11e XX — BI + 
(a) 1/1 + 
1/1 — 0/0 


Une fois que l’on a cette sous-procédure, on peut concevoir l’algorithme global. 


0/0 + 


Start — 
(ao) BIB = (a) 


0/0 + 


OB — BIB — 


UB @) VB > (ao) 


où le rectangle en pointillé signifie “coller ici le programme décrit avant pour la 


sous-procédure”. 

On le voit sur cet exemple, il est possible de programmer les machines de Turing 
de façon modulaire, en utilisant des notions de sous-procédure, qui correspondent en 
fait à des collages de morceaux de programme au sein du programme d’une machine, 


comme sur cet exemple. 


0/0 — 


7.1.5 Applications 


Répétons-le : la seule façon de comprendre tout ce que l’on peut programmer avec 
une machine de Turing consiste à essayer de les programmer. 
Voici quelques exercices. 
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Exercice 7.5. Construire une machine de Turing qui ajoute 1 au nombre écrit en 
binaire (donc avec des 0 et 1) sur son ruban. 


Exercice 7.6. Construire une machine de Turing qui soustrait 1 au nombre écrit en 
binaire (donc avec des 0 et 1) sur son ruban. 


Exercice 7.7. Construire une machine de Turing qui accepte les chaînes de caractère 
avec le même nombre de 0 et de 1. 


7.1.6 Variantes de la notion de machine de Turing 


Le modèle de la machine de Turing est extrêmement robuste. 

En effet, existe de nombreuses variantes possibles autour du concept de machine 
de Turing, qui ne changent rien en fait à ce que l’on arrive à programmer avec ces 
machines. 

On peut en effet assez facilement se persuader des propositions suivantes. 


Restriction à un alphabet binaire 


Proposition 7.1 Toute machine de Turing qui travaille sur un alphabet Y quelconque 
peut être simulée par une machine de Turing qui travaille sur un alphabet Y = T avec 
uniquement deux lettres (sans compter le caractère blanc). 


Démonstration (principe): L’idée est que l’on peut toujours coder les lettres de 
l’alphabet en utilisant un codage en binaire. Par exemple, si l’alphabet © possède 3 
lettres a, b, et c, on peut décider de coder a par 00, b par 01 et c par 10 : voir la figure 
Dans le cas plus général, il faut simplement utiliser éventuellement plus que 2 
lettres. 

On peut alors transformer le programme d’une machine de Turing M qui travaille 
sur l’alphabet Y en un programme 7’ qui travaille sur ce codage. 

Par exemple, si le programme de 17 contient une instruction qui dit que si M est 
dans l’état q, et que la tête de lecture lit un a il faut écrire un c et se déplacer à droite, 
le programme de M” consistera à dire que si l’on est dans l’état q et que l’on lit O en 
face de la tête de lecture, et 0 à sa droite (donc ce qui est à droite de la tête de lecture 
commence par 00, i.e. le codage de a), alors il faut remplacer ces deux 0 par 10 (1e. 
le codage de c) et se rendre dans l’état q/. En faisant ainsi, à chaque fois qu’un calcul 
de M produit un ruban correspondant à un mot w, alors M’ produira un un ruban 
correspondant au codage de w en binaire lettre par lettre. 


Machines de Turing à plusieurs rubans 


On peut aussi considérer des machines de Turing qui auraient plusieurs rubans, 
disons k rubans, où k est un entier. Chacun des k rubans possède sa propre tête de lec- 
ture. La machine possède toujours un nombre fini d’états Q. Simplement, maintenant 
la fonction de transition Ô n’est plus une fonction de Q x TL dans Q x T' x {+ |, —}. 
mais de Q x T'* dans Q x TK x {+-,|,—}# : en fonction de l’état de la machine et de ce 
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Machine M sur l’alphabet {a, b, c} 


Machine M' simulant M sur l’alphabet {0,1}. 


FIGURE 7.2 - Illustration de la preuve de la proposition[7.1] 


qui est lu en face des têtes de lecture de chaque ruban, la fonction de transition donne 
les nouveaux symboles à écrire sur chacun des rubans, et les déplacements à effectuer 
sur chacun des rubans. 

Il est possible de formaliser ce modèle, ce que nous ne ferons pas car cela n’apporte 
pas de réelle nouvelle difficulté. 

On pourra se persuader du résultat suivant : 


Proposition 7.2 Toute machine de Turing qui travaille avec k-rubans peut être simulée 
par une machine de Turing avec un unique ruban. 


Démonstration (principe): L'idée est que si une machine M travaille avec k ru- 
bans sur l’alphabet T', on peut simuler M par une machine M” avec un unique ruban 
qui travaille sur l’alphabet (T x {0,1} U {#}) (qui est toujours un alphabet fini). 

Le ruban de M’ contient la concaténation des contenus des rubans de M, séparés 
par un marqueur #. On utilise (T x {0,1} U {#}) au lieu de (T U {#}) de façon à 
utiliser 1 bit d’information de plus par case qui stocke l’information “la tête de lecture 
est en face de cette case”. 

M va simuler étape par étape les transitions de M : pour simuler une transition 
de M, M' va parcourir de gauche à droite son ruban pour déterminer la position de 
chacune des têtes de lecture, et le symbole en face de chacune des têtes de lecture (en 
mémorisant ces symboles dans son état interne). Une fois connu tous les symboles en 
face de chacune des têtes de lecture, M’ connaît les symboles à écrire et les déplace- 
ments à effectuer pour chacune des têtes : M va parcourir son ruban à nouveau de 
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ruban 1 


BIB|B|B|Bla b\ala b|B B|B|B BB BB | BB 


ruban 3 


BIB|'B|B'Bla albla B|B BIB|B BB BB BB 


© 


Ke 


FIGURE 7.3 - Une machine de Turing à 3 rubans 


ruban 1 ruban 2 ruban 3 


BIBIBlalbia albi#|ib|ic alla |#|ala ba | BB 


FIGURE 7.4 — Illustration de la preuve de la proposition[7.2]: représentation graphique 
d’une machine de Turing à 1 ruban simulant la machine à 3 rubans de la figure [7.3] 
Sur cette représentation graphique, on écrit une lettre primée lorsque le bit “la tête de 
lecture est en face de cette case” est à 1. 
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gauche à droite pour mettre à jour son codage de l’état de M. En faisant ainsi systéma- 
tiquement transition par transition, M' va parfaitement simuler l’évolution de M avec 
son unique ruban : voir la figure[7.1.6] 


Machines de Turing non-déterministes 


On peut aussi introduire le concept de machine de Turing non-déterministe : la 
définition d’une machine de Turing non-déterministe est exactement comme celle de la 
notion de machine de Turing (déterministe) sauf sur un point. Ô n’est plus une fonction 
de Q x T'dans Q x T x {+-,|, —}, mais une relation de la forme 


OC(QXT)xX(QXTX{E.,}, —}). 


En d’autres termes, pour un état et une lettre lue en face de la tête de lecture donnée, 
ô ne définit pas un seul triplet de Q x T x {+-,|,—}, mais un ensemble de triplets. 
Intuitivement, lors d’une exécution la machine a la possibilité de choisir n’importe quel 
triplet. 

Formellement, cela s’exprime par le fait que l’on peut passer de la configura- 
tion C à la configuration successeur C” si et seulement si on peut passer de C à C” 
(ce que nous notons € H C”) avec les définitions précédentes, mais en remplaçant 
ô(q,a) = (g',a',m') par ((q,a),(q',a',m')) € 6. Les autres définitions sont alors 
essentiellement inchangées, et comme pour les machines de Turing déterministes. 

La différence est qu’une machine de Turing non-déterministe n’a pas une exécution 
unique sur une entrée w, mais éventuellement plusieurs : en fait, les exécutions de la 
machine sur un mot w donnent lieu à un arbre de possibilité, et l’idée est qu’on ac- 
cepte (respectivement : refuse) un mot si l’une des branches contient une configuration 
acceptante (resp. de refus). 

La notion de mot w accepté est (toujours) donnée par définition[7.3] 

Le langage L C X* accepté par M est (toujours) l’ensemble des mots w qui sont 
acceptés par la machine. On le note (toujours) L(M). On appelle (toujours) L(M) 
aussi le langage reconnu par M. 

On évite dans ce contexte de parler en général de mot refusé. 

On dira cependant qu’un langage L C X* est décidé par M si il est accepté par une 
machine qui termine sur toute entrée : c’est-à-dire telle que pour w € L, la machine 
possède un calcul qui mène à une configuration acceptante comme dans la définition 
et pour w & L, tous les calculs de la machine mènent à une configuration refusante. 

On peut prouver le résultat suivant (ce que nous ferons dans un chapitre ultérieur). 


Proposition 7.3 Une machine de Turing non-déterministe peut être simulée par une 
machine de Turing déterministe : un langage L est accepté par une machine de Turing 
non-déterministe si et seulement si il est accepté par une machine de Turing (détermi- 
niste). 


Évidemment, on peut considérer une machine de Turing comme une machine de 
Turing non-déterministe particulière. Le sens moins trivial de la proposition est que 
l’on peut simuler une machine de Turing non-déterministe par une machine de Turing 
(déterministe). 
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Autrement dit, autoriser du non-déterministe n’étend pas le modèle, tant que l’on 
parle de calculabilité, c’est-à-dire de ce que l’on peut résoudre. Nous verrons qu’en ce 
qui concerne la complexité, cela est une autre paire de manches. 


7.1.7 Localité de la notion de calcul 


Voici une propriété fondamentale de la notion de calcul, que nous utiliserons à de 
plusieurs reprises, et que nous invitons notre lecteur à méditer : 


Proposition 7.4 (Localité de la notion de calcul) Considérons le diagramme espace- 
temps d’une machine M. Regardons les contenus possibles des sous-rectangles de lar- 
geur 3 et de hauteur 2 dans ce diagramme. Pour chaque machine M, il y a un nombre 
fini possible de contenus que l’on peut trouver dans ces rectangles. Appelons fenêtres 
légales, les contenus possibles pour la machine M : voir la figure[7.6] 

Par ailleurs, cela fournit même une caractérisation des diagrammes espace-temps 
d'une machine donnée : un tableau est un diagramme espace-temps de M sur une 
certaine configuration initiale Co si et seulement si d’une part sa première ligne cor- 
respond à Co, et d’autre part dans ce tableau, le contenu de tous les rectangles de 
largeur 3 et de hauteur 2 possible sont parmi les fenêtres légales. 


Démonstration: Il suffit de regarder chacun des cas possibles et de s’en convaincre, 
ce qui est fastidieux, mais sans aucune difficulté particulière. 
Nous y reviendrons. Oublions-la pour l'instant, et revenons à d’autres modèles. 


Remarque 7.4 C'est aussi vrai dans les autres modèles dans un certain sens. Toute- 
fois, cela y est toutefois beaucoup plus difficile à formuler 


7.2 Machines RAM 


Le modèle de la machine de Turing peut paraître extrêmement rudimentaire. Il n’en 
demeure pas extrêmement puissant, et capable de capturer la notion de calculable en 
informatique. 

L'objectif de cette section est de se persuader de ce fait : tout ce qui est program- 
mable par un dispositif de calcul informatique digital actuel peut se simuler par une 
machine de Turing. Pour cela, on va introduire un modèle très proche (le plus proche 
en fait que je connaisse) de la façon dont fonctionnent les processeurs actuels : le mo- 
dèle des machines RAM. 


7.2.1 Modèle des machines RAM 


Le modèle des machines RAM (Random Access Machine) est un modèle de calcul 
qui ressemble beaucoup plus aux langages machine actuels, et à la façon dont fonc- 
tionnent les processeurs actuels. 

Une machine RAM possède des registres qui contiennent des entiers naturels (nuls 
si pas encore initialisés). Les instructions autorisées dépendent du processeur que l’on 
veut modéliser (ou de l’ouvrage que l’on consulte qui décrit ce modèle), mais elles 
incluent en général la possibilité de : 
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go | 0 


S10S10101S/1S © © 


Du mimi mm mm |œ 
Dim mimi mm) m|w 
Dim mimi mm mm |w 
Dim mimi mm m|w 
Dim mimi mm) m|w 
Dim mm mm mm 


Dim Um DIX | 
mm Um DIX œm'|E 
Dim UE DIX EX 
mm Um DIX | 
S 
x 
[e} 
<<< <=) -|- 


Dim mm mm mm 
Dim mm mm m|w 
Dim mimi mm mm |w 
Dim mimi mm) m|w 
Dim mimi mm mm |w 


* 
< 
[æ} 
& 


1101B 
Y 0)B 


FIGURE 7.5 — (a). Le diagramme espace-temps de l’exemple[7.7| sur lequel est grisé 
un sous-rectangle 3 x 2. (b) La fenêtre (légale) correspondante. 


a Ib ald4|b a |a|q 
(a) (b) (c) 

gælalc a | a | 42 a alb 

#|b|a alba b b 
(d) (e) (2) 

#|b|a a | b |4 b 


FIGURE 7.6 — Quelques fenêtres légales pour une autre machine de Turing M : on 
peut rencontrer chacun de ces contenus dans un sous-rectangle 3 x 2 du diagramme 
espace-temps de M. 
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(a) (b) (c) 
a a 


FIGURE 7.7 — Quelques fenêtres illégales pour une certaine machine M avec 6(q1,b) = 
(gi,c,+). On ne peut pas rencontrer ces contenus dans un sous-rectangle 3 x 2 du 
diagramme espace-temps de 1] : En effet, dans (a), le symbole central ne peut pas 
changer sans que la tête lui soit adjacente. Dans (b), le symbole en bas à droite devrait 
être un c mais pas un a, selon la fonction de transition. Dans (c), il ne peut pas y avoir 
deux têtes de lecture sur le ruban. 


1. copier le contenu d’un registre dans un autre ; 


2. faire un adressage indirect : récupérer/écrire le contenu d’un registre dont le nu- 
méro est donné par la valeur d’un autre registre ; 


3. effectuer des opérations élémentaires sur un ou des registres, par exemple addi- 
tionner 1, soustraire 1 ou tester l’égalité à 0; 


4. effectuer d’autres opérations sur un ou des registres, par exemple l’addition, la 
soustraction, la multiplication, division, les décalages binaires, les opérations 
binaires bit à bit. 

Dans ce qui suit, nous réduirons tout d’abord la discussion aux SRAM (Successor 
Random Access Machine) qui ne possèdent que des instructions des types 1., 2. et 3. 
Nous verrons qu’en fait cela ne change pas grand chose, du moment que chacune des 
opérations du type 4. se simule par machine de Turing (et c’est le cas de tout ce qui est 
évoqué plus haut). 


7.2.2 Simulation d’une machine RISC par une machine de Turing 


Nous allons montrer que toute machine RAM peut être simulée par une machine 
de Turing. 

Pour aider à la compréhension de la preuve, nous allons réduire le nombre d’ins- 
tructions des machines RAM à un ensemble réduit d'instructions (RISC reduced ins- 
truction set en anglais) en utilisant un unique registre x, comme accumulateur. 


Définition 7.11 Une machine RISC est une machine SRAM dont les instructions sont 
uniquement de la forme : 


1. To <— 0; 

To — Lo + 1 . 

To — oO 1 ; 

ff xo = Othen aller à l’ instruction numéro j ; 
ribenl rs 2 


Li — Lo ; 


N S HR © D 


TO $— Lx, > 
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8. Lro + Li. 


Clairement, tout programme RAM avec des instructions du type 1., 2. et 3. peut 
être converti en un programme RISC équivalent, en remplaçant chaque instruction par 
des instructions qui passent systématiquement par l’accumulateur xo. 


Théorème 7.1 Toute machine RISC peut être simulée par une machine de Turing. 


Démonstration: La machine de Turing qui simule la machine RISC possède 4 ru- 
bans. Les deux premiers rubans codent les couples (4, x;) pour x; non nul. Le troisième 
ruban code l’accumulateur x et le quatrième est un ruban de travail. 

Plus concrètement, pour un entier à, notons (1) son écriture en binaire. Le premier 
ruban code un mot de la forme 


.. BB(i)Blu):--B...(x)BB:... 
Le second ruban code un mot de la forme 


Les têtes de lecture des deux premiers rubans sont sur le deuxième B. Le troisième 
ruban code (x0), la tête de lecture étant tout à gauche. Appelons position standard une 
telle position des têtes de lecture. 

La simulation est décrite pour trois exemples. Notre lecteur pourra compléter le 
reste. 


1. Zo + to + 1 : on déplace la tête de lecture du ruban 3 tout à droite jusqu’à 
atteindre un symbole B. On se déplace alors d’une case vers la gauche, et on 
remplace les 1 par des O, en se déplaçant vers la gauche tant que possible. Lors- 
qu’un 0 ou un B est trouvé, on le change en 1 et on se déplace à gauche pour 
revenir en position standard. 


2. t23 + To : on parcourt les rubans 1 et 2 vers la droite, bloc délimité par B par 
bloc, jusqu’à atteindre la fin du ruban 1, ou ce que l’on lise un bloc B10111B 
(10111 correspond à 23 en binaire). 

Si la fin du ruban 1 a été atteinte, alors l’emplacement 23 n’a jamais été vu 
auparavant. On l’ajoute en écrivant 10111 à la fin du ruban 1, et on recopie le 
ruban 3 (la valeur de x0) sur le ruban 2. On retourne alors en position standard. 
Sinon, c’est que l’on a trouvé B10111B sur le ruban 1. On lit alors (x23) sur le 
ruban 2. Dans ce cas, il doit être modifié. On fait cela de la façon suivante : 


(a) On copie le contenu à droite de la tête de lecture numéro 2 sur le ruban 4. 


(b) On copie le contenu du ruban 3 (la valeur de x) à la place de x23 sur le 
ruban 2. 


(c) On écrit B, et on recopie le contenu du ruban 4 à droite de la tête de lecture 
du ruban 2, de façon à restaurer le reste du ruban 2. 


(d) On retourne en position standard. 
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3. to Zx,, : En partant de la gauche des rubans 1 et 2, on parcourt les rubans 1 

et 2 vers la droite, bloc délimité par B par bloc, jusqu’à atteindre la fin du ruban 
1, ou ce que l’on lise un bloc B10111B (10111 correspond à 23 en binaire). 
Si la fin du ruban 1 a été atteinte, on ne fait rien, puisque x23 vaut 0 et le ruban 3 
contient déjà (to). 
Sinon, c’est que l’on a trouvé B10111B sur le ruban 1. On lit alors (x23) sur le 
ruban 2, que l’on recopie sur le ruban 4. Comme ci-dessus, on parcourt les rubans 
1 et 2 en parallèle jusqu’à trouver B{x23) B où atteindre la fin du ruban 1. Si la 
fin du ruban 1 est atteinte, alors on écrit O sur le ruban 3, puisque %:,, = %o. 
Sinon, on copie le bloc correspondant sur le ruban 1 sur le ruban 3, puisque le 
bloc sur le ruban 2 contient +,.,, et on retourne en position standard. 


7.2.3 Simulation d’une machine RAM par une machine de Turing 


Revenons sur le fait que nous avons réduit l’ensemble des opérations autorisées sur 
une machine RAM aux instructions du type 1., 2. et 3. En fait, on observera que l’on 
peut bien gérer toutes instructions du type 4., du moment que l’opération sous-jacente 
peut bien se calculer par machine de Turing : toute opération 0 + xo ‘‘opération”” x; 
peut être simulée comme plus haut, dès que ‘‘ opération ” ” correspond à une opération 
calculable. 


7.3 Modèles rudimentaires 


Le modèle des machines des Turing est extrêmement rudimentaire. On peut toute- 
fois considérer des modèles qui le sont encore plus, et qui sont toutefois capable de les 
simuler. 


7.3.1 Machines à £ > 2 piles 


Une machine à k piles, possède un nombre fini k de piles r1,Tr2,--- ,rx, qui corres- 
pondent à des piles d’éléments de Y. Les instructions d’une machine à piles permettent 
seulement d’empiler un symbole sur l’une des piles, tester la valeur du sommet d’une 
pile, ou dépiler le symbole au sommet d’une pile. 

Si l’on préfère, on peut voir une pile d’éléments de Y comme un mot w sur l’alpha- 
bet ©. Empiler (push) le symbole a € M correspond à remplacer w par aw. Tester la 
valeur du sommet d’une pile (top) correspond à tester la première lettre du mot w. Dé- 
piler (pop) le symbole au sommet de la pile correspond à supprimer la première lettre 
de w. 


Théorème 7.2 Toute machine de Turing peut être simulée par une machine à 2 piles. 


Démonstration: Selon la formalisation de la page[96| une configuration d’une ma- 
chine de Turing correspond à C = (q,u, v), où u et v désignent le contenu respective- 
ment à gauche et à droite de la tête de lecture du ruban i. On peut voir u et v comme des 
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FIGURE 7.8 — Une machine à 3 piles. 
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FIGURE 7.9 — La machine de Turing de l’exemple vue comme une machine à 
2-piles. 
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piles : voir la figure[7.9] Si l’on relit attentivement la formalisation page[06] on observe 
que les opérations effectuées par le programme de la machine de Turing pour passer de 
la configuration Ca sa configuration successeur C” correspondent à des opérations qui 
se codent trivialement par des push, pop, et top : on peut donc construire une machine 
à 2 piles, chaque pile codant u ou v (le contenu à droite et à gauche de chacune des 
têtes de lecture), et qui simule étape par étape la machine de Turing. 


7.3.2 Machines à compteurs 


Nous introduisons maintenant un modèle encore plus rudimentaire : une machine à 
compteurs possède un nombre fini k de compteurs r1,72,--: ,rx, qui contiennent des 
entiers naturels. Les instructions d’une machine à compteur permettent seulement de 
tester l’égalité d’un des compteurs à 0, d’incrémenter un compteur ou de décrémenter 
un compteur. Tous les compteurs sont initialement nuls, sauf celui codant l’entrée. 


Remarque 7.5 C’est donc une machine RAM, mais avec un nombre très réduit d’ins- 
tructions, et un nombre fini de registres. 


Plus formellement, toutes les instructions d’une machine à compteurs sont d’un des 
À types suivants. 

— Inc(c, j) : on incrémente le compteur c puis on va à l'instruction 3. 

— Decr(c, j) : on décrémente le compteur c puis on va à l’instruction j. 

— IsZero(c, j, k) : on teste si le compteur c est nul et on va à l’instruction j si c’est 

le cas, et à l’instruction k sinon. 
— Halt : on arrête le calcul. 
Par exemple, le programme suivant avec 3 compteurs 


1. IsZero(1, 5,2) 
2. Decr(1,3) 
3. Inc(3,4) 
4. Inc(3, 1) 
5. Halt 
transforme (n,0,0) en (0,0,2n) : si l’on part avec r1 = n, r2 = r3 = 0, alors 


lorsqu’on atteint l'instruction Halt, on a r3 = 2n, et les autres compteurs à 0. 


Exercice 7.8. Pour chacune des conditions suivantes, décrire des machines à comp- 
teur qui atteignent l'instruction Halt si et seulement si la condition est initialement 
vérifiée. 

— 7127221 

— 11 =7T20UT1 =7T3 

— T1 — 72 OUT] — T3 OUT2 —7T3 


Théorème 7.3 Toute machine à k-piles peut être simulée par une machine à k +1 
compteurs. 
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Démonstration: L'idée est de voir une pile w — aja2::-a, sur l’alphabet Y de 
cardinalité r — 1 comme un entier en base r : sans perte de généralité, on peut voir 
Z comme E = {0,1,--:,r — 1}. Le mot w correspond à l’entier à = a,r"-! + 
An1r 2 + ee: Qor + ar. 

On utilise ainsi un compteur pour chaque pile. Un k + 1ème compteur, que l’on 
appellera compteur supplémentaire, est utilisé pour ajuster les compteurs et simuler 
chaque opération (empilement, dépilement, lecture du sommet) sur l’une des piles. 

Dépiler correspond à remplacer à par à div r, où div désigne la division entière : 
en partant avec le compteur supplémentaire à 0, on décrémente le compteur à de r (en 
r étapes) et on incrémente le compteur supplémentaire de 1. On répète cette opération 
jusqu’à ce que le compteur à atteigne 0. On décrémente alors le compteur supplémen- 
taire de 1 en incrémentant le compteur à de 1 jusqu’à ce que le premier soit 0. À ce 
moment, on lit bien le résultat correct dans le compteur 1. 

Empiler le symbole a correspond à remplacer à par ixr+a : on multiplie d’abord par 
r : en partant avec le compteur supplémentaire à 0, on décrémente le compteur à de 1 et 
on incrémente le compteur supplémentaire de r (en r étapes) jusqu’à ce que le compteur 
à soit à 0. On décrémente alors le compteur supplémentaire de 1 en incrémentant le 
compteur à de 1 jusqu’à ce que le premier soit 0. À ce moment, on lit à x r dans le 
compteur à. On incrémente alors le compteur à de a (en a incrémentations). 

Lire le sommet d’une pile à correspond à calculer à mod r, où à mod r désigne le 
reste de la division euclidienne de à par r : en partant avec le compteur supplémentaire 
à 0, on décrémente le compteur à de 1 et on incrémente le compteur supplémentaire 
de 1. Lorsque le compteur à atteint O0 on s’arrête. On décrémente alors le compteur 
supplémentaire de 1 en incrémentant le compteur à de 1 jusqu’à ce que le premier soit 
0. On fait chacune de ces opérations en comptant en parallèle modulo r dans l’état 
interne de la machine. 


Théorème 7.4 Toute machine à k > 3 compteurs se simule par une machine à 2 
compteurs. 


Démonstration: Supposons d’abord k — 3. L'idée est coder trois compteurs à, j et 
k par l’entier m = 2*3/5%, L'un des compteurs stocke cet entier. L'autre compteur est 
utilisé pour faire des multiplications, divisions, calculs modulo m, pour m valant 2, 3, 
Ou 5. 

Pour incrémenter à, j ou k de 1, il suffit de multiplier m par 2, 3 ou 5 en utilisant le 
principe de la preuve précédente. 

Pour tester si à, j ou k = 0, il suffit de savoir si m est divisible par 2, 3 ou 5, en 
utilisant le principe de la preuve précédente. 

Pour décrémenter +, j ou k de 1, il suffit de diviser m par 2, 3 ou 5 en utilisant le 
principe de la preuve précédente. 

Pour k > 3, on utilise le même principe, mais avec les k premiers nombres premiers 
au lieu de simplement 2, 3, et 5. 


Exercice 7.9. Reprendre l’exercice précédent en utilisant systématiquement au plus 
2 compteurs. 


En combinant les résultats précédents, on obtient : 
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Corollaire 7.1 Toute machine de Turing se simule par une machine à 2 compteurs. 


Observons que la simulation est particulièrement inefficace : la simulation d’un 
temps t de la machine de Turing nécessite un temps exponentiel pour la machine à 2 
compteurs. 


74 Thèse de Church-Turing 


7.4.1 Équivalence de tous les modèles considérés 


Nous avons jusque-là introduit différents modèles, et montré qu’ils pouvaient tous 
être simulés par des machines de Turing, ou simuler les machines de Turing. 

En fait, tous ces modèles sont équivalents au niveau de ce qu’ils calculent : on a 
déjà montré que les machines RAM pouvaient simuler les machines de Turing. On peut 
prouver le contraire. On a montré que les machines à compteurs, et les machines à piles 
simulaient les machines de Turing. Il est facile de voir que le contraire est vrai : on peut 
simuler l’évolution d’une machine à piles ou d’une machine à compteurs par machine 
de Turing. Tous les modèles sont donc bien équivalents, au niveau de ce qu’ils sont 
capables de calculer. 


74.2 Thèse de Church-Turing 


C’est l’ensemble de ces considérations qui ont donné naissance à la thèse de Church- 
Turing, exprimée très explicitement pour la première fois par Stephen Kleene, étudiant 
de Alonzo Church. Cette thèse affirme que “ce qui est effectivement calculable est 
calculable par une machine de Turing.” 

Dans cette formulation, la première notion de “calculable” fait référence à une 
notion donnée intuitive, alors que la seconde notion de “calculable” signifie “calculable 
par une machine de Turing”, 1.e. une notion formelle. 

Puisqu’il n’est pas possible de définir formellement la première notion, cette thèse 
est une thèse au sens philosophique du terme. Il n’est pas possible de la prouver. 

La thèse de Church est très largement admise. 


7.5 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de |[Hopcroft et al., 2001| en anglais, ou de [Wolper, 2001], 
IStern, 1994] [Carton, 2008] en français. 


D’autres formalismes équivalents aux machines de Turing existent. En particulier, 
la notion de fonctions récursives, qui est présentée par exemple dans [Dowek, 2008], 
[Stern, 1994] ou dans [Cori and Lascar, 1993b)]. 


Bibliographie Ce chapitre a été rédigé à partir de la présentation des machines de Tu- 


ring dans [Wolper, 20011, et des discussions dans [Hopcroft et al., 2001| pour la partie 
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sur leur programmation. La partie sur les machines RAM est inspirée de [|Papadimitriou, 1994 
et de [Jones, 1997]. 
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Chapitre 8 


Calculabilité 


Ce chapitre présente les principaux résultats de la calculabilité. En d’autres termes, 
nous cherchons à comprendre la puissance des programmes informatiques. On y prouve 
que certains problèmes peuvent se résoudre informatiquement et que certains pro- 
blèmes ne peuvent pas l'être. L'objectif est d’explorer les limites de la programmation 
informatique. 

En pratique, on peut se dire qu’en informatique on s’intéresse à résoudre des pro- 
blèmes, en les programmant, par des algorithmes, et que s’intéresser aux problèmes 
que l’on ne sait pas programmer ne présente que peu d’intérêt. Tout d’abord il convient 
de comprendre que les problèmes auquels nous allons nous intéresser ne sont pas vrai- 
ment des problèmes pour lesquels on ne connaît pas de solution, mais, et c’est en encore 
beaucoup plus fort, des problèmes pour lesquels on sait qu’il est impossible de produire 
une solution algorithmique. 

Pourquoi s’intéresser à comprendre les problèmes qui ne peuvent pas être résolus ? 
Premièrement, parce que comprendre qu’un problème ne peut pas être résolu est utile. 
Cela signifie que le problème doit être simplifié ou modifié pour pouvoir être résolu. 
Deuxièmement, parce que tous ces résultats sont culturellement très intéressants et per- 
mettent de bien mettre en perspective la programmation, et les limites des dispositifs de 
calculs, ou de l’automatisation de certaines tâches, comme par exemple la vérification. 


8.1 Machines universelles 


8.1.1 Interpréteurs 


Un certain nombre de ces résultats est la conséquence d’un fait simple, mais qui 
mène à de nombreuses conséquences : on peut programmer des interpréteurs, c’est-à- 
dire des programmes qui prennent en entrée la description d’un autre programme et qui 
simulent ce programme. 


Exemple 8.1 Un langage comme JAVA est interprèté : un programme JAVA est com- 
pilé en une description dans un codage que l’on appelle bytecode. Lorsqu'on cherche à 
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lancer ce programme, l’interpréteur JAVA simule ce bytecode. Ce principe d’interpré- 
tation permet à un programme JAVA de fonctionner sur de nombreuses plates-formes 
et machines directement : seulement l’interpréteur dépend de la machine sur laquelle 
on exécute le programme. Le même bytecode peut être lancé sur toutes les machines. 
C’est en partie ce qui a fait le succès de JAVA : sa portabilité. 


La possibilité de programmer des interpréteurs est donc quelque chose d’extrême- 
ment positif. 

Cependant, cela mène aussi à de nombreux résultats négatifs ou paradoxaux à pro- 
pos de l’impossibilité de résoudre informatiquement certains problèmes, même très 
simples, comme nous allons le voir dans la suite. 

Programmer des interpréteurs est possible dans tous les langages de programma- 
tion usuels, en particulier même pour les langages aussi rudimentaires que ceux des 
machines de Turing. 


Remarque 8.1 Nous n’allons pas parler de JAVA dans ce qui suit, mais plutôt de pro- 
grammes de machines de Turing. Raisonner sur JAVA (ou tout autre langage) ne ferait 
que compliquer la discussion, sans changer le fond des arguments. 


Commençons par nous persuader que l’on peut réaliser des interpréteurs pour les 
machines de Turing : dans ce contexte, on appelle cela des machines de Turing univer- 
selles. 


8.1.2 Codage d’une machine de Turing 


Il nous faut fixer une représentation des programmes des machines de Turing. Le 
codage qui suit n’est qu’une convention. Tout autre codage qui garantit la possibilité 
de décoder (par exemple dans l'esprit du lemme{8.1} ferait l'affaire. 


Définition 8.1 (Codage d’une machine de Turing) Soit M une machine de Turing 
sur l’alphabet Z = {0,1}. 
Selon la définition[7. 1] M correspond à un 8-uplet 


M — (02,7 B;0, 40; Ga» Gr) : 


— Q est un ensemble fini, dont on peut renommer les états Q = {q1,q2,--: ,q:}, 
avec la convention que q1 = Go, 42 = Gas 43 = Gr; 
— Test un ensemble fini, dont on peut renommer les états T = {X1,X2,---, X,}, 


avec la convention que X, est le symbole B, et que X\ est le symbole 0 de Y,, et 
que X2 est le symbole 1 de Y. 

Pour m € {+,|,—+}, définissons (m) de la façon suivante : (+) = 1, (|) = 2, 
(=) =3. 

On peut alors coder la fonction de transition Ô de la façon suivante : supposons 
que l’une des règles de transition soit 6(qi, X;) = (qx, X1,m) : le codage de cette 
règle est le mot 0°10710*10/1(" sur l'alphabet {0,1}. Observons que puisque tous 
les entiers à, j, k,l sont non nuls, il n’y pas de 1 consécutif dans ce mot. 
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Un codage, noté (M), de la machine de Turing M est un mot sur l’alphabet {0,1} 
de la forme 
Ci11C211C3 - +: Cn-111Cn, 


où chaque C; est le codage d’une des règles de transition de 6. 


Remarque 8.2 À une machine de Turing peuvent correspondre plusieurs codages : on 
peut en particulier permuter les (C;);, ou les états, etc... 


Le seul intérêt de ce codage est qu’il est décodable : on peut retrouver chacun des 
ingrédients de la description d’une machine de Turing à partir du codage de la machine. 
Par exemple, si l’on veut retrouver le déplacement m pour une transition donnée : 


Lemme 8.1 (Décodage du codage) On peut construire une machine de Turing M à 
quatre rubans, telle que si l’on met un codage (M) d'une machine M' sur son premier 
ruban, 0° sur son second, et OŸ sur son troisième, M produit sur son quatrième ruban 
le codage (m) du déplacement m € {+;|,—} tel que O(qi, X;) = (qk, X1, m) où Ô 
est la fonction de transition de la machine de Turing M. 


Démonstration (principe): On construit une machine qui parcourt le codage de 
M jusqu’à trouver le codage de la transition correspondante, et qui lit dans le codage 
de cette transition la valeur de m désirée. 

Nous aurons aussi besoin de coder des couples constitués du codage d’une machine 
de Turing M et d’un mot w sur l’alphabet {0, 1}. Une façon de faire est de définir le 
codage de ce couple, noté {(M),w) par 


((M),w) = (M)1lw, 


c’est-à-dire comme le mot obtenu en concaténant le codage de la machine de Turing M, 
trois fois le symbole 1, puis le mot w. Notre choix de codage d’une machine de Turing 
ne produisant jamais trois 1 consécutifs, l’idée est qu’on peut alors bien retrouver à 
partir du mot (M, 1)11w ce qui correspond à M et ce qui correspond à w : bref, on 
peut bien décoder. 


8.1.3 Coder des paires, des triplets, etc... 


Nous venons de fixer un codage qui fonctionne pour une machine de Turing et un 
mot, mais on peut faire la remarque suivante : on peut de façon très générale fixer une 
façon de coder deux mots w, et w2 en un unique mot w, c’est-à-dire de coder un couple 
de mots, 1.e. un élément X* x X*, par un mot, c’est-à-dire un unique élément de >}*, 
que l’on notera (w1, w2). 

Comment faire cela ? 

Une première façon est de coder deux mots sur © par un unique mot sur un alphabet 
plus grand, de telle sorte que l’on soit capable de retrouver ces mots. 

Par exemple, on peut décider de coder les mots wi € X* et w2 € X* par le mot 
w1#w2 sur l’alphabet Z U {#}. Une machine de Turing peut alors retrouver à partir 
de ce mot à la fois w et wo. 
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On peut même recoder le mot obtenu en binaire lettre par lettre pour obtenir une 
façon de coder deux mots sur Z = {0,1} par un unique mot sur Z = {0,1} : par 
exemple, si w1#w2 s'écrit lettre à lettre a1a2 : : : a, sur l'alphabet Z U {4}, on définit 
{w1l,w2) comme le mot e(ai)e(a2)...e(a) où e(0) = 00, e(1) = 01 et e(#) = 10. 
Ce codage est encore décodable : à partir de (w1,w2), une machine de Turing peut 
reconstruire w1 et Wo. 

Par la suite, nous noterons (w1,w2) le codage de la paire constituée du mot w1 et 
du mot wo. 

On observera que les résultats qui suivent ne dépendent pas vraiment du codage 
utilisé pour les paires : on peut donc coder une paire constitué d’une machine de Tu- 
ring et d’un mot comme dans la section précédente, ou le considérer comme {{1),w), 
c’est-à-dire le codage du couple constitué du codage de la machine et du mot, indiffé- 
remment. 


8.1.4 Existence d’une machine de Turing universelle 


Ces discussions préliminaires étant faites, on peut se convaincre que l’on peut réa- 
liser un interpréteur, c’est-à-dire ce que l’on appelle une machine de Turing universelle 
dans le contexte des machines de Turing. 

Cela donne le théorème suivant : 


Théorème 8.1 (Existence d’une machine de Turing universelle) // existe une machine 
de Turing Muniv telle, que sur l'entrée {((A), w) où : 


1. (A) est le codage d’une machine de Turing À ; 
2. we {0,1}*; 


Myniv simule la machine de Turing À sur l’entrée w. 


Démonstration: On peut facilement se convaincre qu’il existe une machine de Tu- 
ring Muniv à trois rubans telle que si l’on place : 

— le codage (A) d’une machine de Turing À sur le premier ruban ; 

— un mot w sur l’alphabet Z = {0, 1} sur le second; 
alors Myniv Simule la machine de Turing À sur l’entrée w en utilisant son troisième 
ruban. 

En effet, la machine M,;, simule transition par transition la machine À sur l’en- 
trée w sur son second ruban : Mani, utilise le troisième ruban pour y stocker 07 où q 
code l’état de la machine À à la transition que l’on est en train de simuler : initialement, 
ce ruban contient O, le codage de qo. 

Pour simuler chaque transition de À, Muni, lit la lettre X; en face de sa tête de 
lecture sur le second ruban, va lire dans le codage (A) sur le premier ruban la valeur de 
ge, X1 et m, pour la transition 0(qi, X;) — (gx, X1,m) de À, où 0 est le contenu du 
troisième ruban. Muni, écrit alors X, sur son second ruban, écrit gx sur son troisième 
ruban, et déplace la tête de lecture selon le déplacement m sur le second ruban. 

Pour prouver le résultat, il suffit alors d’utiliser une machine de Turing avec un 
unique ruban qui simule la machine à plusieurs rubans précédente, après avoir décodé 
(A) et w à partir de son entrée. 
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8.1.5 Premières conséquences 


Voici une première utilisation de l’existence d’interpréteurs : la preuve de la pro- 
position[7.3] c’est-à-dire la preuve qu’une machine de Turing non déterministe M] peut 
être simulée par une machine de Turing déterministe. 

La preuve est la suivante : la relation de transition de la machine non déterministe 
M est nécessairement de degré de non determinisme borné : c’est-à-dire, le nombre 


r = matgequerl{((q,a),(q',a',m)) € 6}] 


est fini (|.| désigne le cardinal). 

Supposons que pour chaque paire (q, a) on numérote les choix parmi la relation de 
transition de la machine non déterministe 1{ de 1 à (au plus) r. À ce moment-là, pour 
décrire les choix non déterministes effectués dans un calcul jusqu’au temps #, il suffit 
de donner une suite de { nombres entre 1 et (au plus) r. 

On peut alors construire une machine de Turing (déterministe) qui simule la ma- 
chine M de la façon suivante : pour { = 1,2,--., elle énumère toutes les suites de 
longueur { d’entiers entre 1 et r. Pour chacune de ces suites, elle simule + étapes de la 
machine M en utilisant les choix donnés par la suite pour résoudre chaque choix non 
déterministe de M. La machine s’arrête dès qu’elle trouve t et une suite telle que M 
atteint une configuration acceptante. 


8.2 Langages et problèmes décidables 


Une fois ces résultats établis sur l’existence de machines universelles (interpré- 
teurs), nous allons dans cette section essentiellement présenter quelques définitions. 

Tout d’abord, il nous faut préciser que l’on s’intéresse dorénavant dans ce chapitre 
uniquement aux problèmes dont la réponse est soit vraie soit fausse, et ce, essentielle- 
ment pour simplifier la discussion : voir la figure[8.1] 


8.2.1 Problèmes de décision 


Définition 8.2 Un problème de décision P est la donnée d’un ensemble E, que l’on 
appelle l’ensemble des instances, et d'un sous-ensemble E* de E, que l’on appelle 
l’ensemble des instances positives. 


La question à laquelle on s’intéresse est de construire (si cela est possible) un al- 
gorithme qui décide si une instance donnée est positive ou non. On va formuler les 
problèmes de décision systématiquement sous la forme : 


Définition 8.3 (Nom du problème) 
Donnée: Une instance (i.e. un élément de FE). 
Réponse: Décider une certaine propriété (i.e. si cet élément est dans E*). 


On peut par exemple considérer les problèmes suivants : 


Exemple 8.2 Définition 8.4 (NOMBRE PREMIER) 
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FIGURE 8.1 — Problèmes de décision : dans un problème de décision, on a une pro- 
priété qui est soit vraie soit fausse pour chaque instance. L'objectif est de distinguer les 
instances positives ET (où la propriété est vraie) des instances négatives E\ET (où la 
propriété est fausse). 


Donnée: Un entier naturel n. 
Réponse: Décider si n est premier. 


Exemple 8.3 Définition 8.5 (CODAGE) 
Donnée: Un mot w. 
Réponse: Décider si w correspond au codage (M) d’une certaine machine de 
Turing M. 


Exemple 8.4 Définition 8.6 (REACH) 
Donnée: Un triplet constitué d’un graphe G, d’un sommet u et d’un sommet v du 
graphe. 
Réponse: Décider s’il existe un chemin entre u et v dans le graphe G. 


8.2.2 Problèmes versus Langages 


On utilise indifféremment la terminologie problème ou langage dans tout ce qui 
suit. 


Remarque 8.3 (Problèmes vs langages) Cela découle des considérations suivantes : 
à un problème (de décision) est associé un langage et réciproquement. 

En effet, à un problème est associé généralement implicitement une fonction de 
codage (par exemple pour les graphes, une façon de coder les graphes) qui permet de 
coder les instances, c’est-à-dire les éléments de E, par un mot sur un certain alphabet 
X. On peut donc voir E comme un sous-ensemble de X*, où Y est un certain alphabet : 
au problème de décision P, on associe le langage L(P) correspondant à l’ensemble 
des mots codant une instance de E, qui appartient à ET : 


L(P) = {ul € Et}. 
Réciproquement, on peut voir tout langage L comme un problème de décision, en 


le formulant de cette façon : 


Définition 8.7 (Problème associé au langage L) 
Donnée: Un mot w. 
Réponse: Décider si w € L. 


8.3. INDÉCIDABILITÉ 125 


8.2.3 Langages décidables 


On rappelle la notion de langage décidé, qui invite à introduire la notion de langage 
décidable. 


Définition 8.8 (Langage décidable) Un langage L C M* est dit décidable s’il est 
décidé par une certaine machine de Turing. 


Un langage ou un problème décidable est aussi dit récursif. Un langage qui n’est 
pas décidable est dit indécidable. 

On note R pour la classe des langages et des problèmes décidables. 

Par exemple : 


Proposition 8.1 Les problèmes de décision NOMBRE PREMIER, CODAGE et REACH 
sont décidables. 


La preuve consiste à construire une machine de Turing qui reconnaît respective- 
ment si son entrée est un nombre premier, le codage d’une machine de Turing, où 
une instance positive de REACH, ce que nous laissons en exercice de programmation 
élémentaire à notre lecteur. 


Exercice 8.1. Soit À le langage constitué de la seule chaine s où 


O si Dieu n'existe pas 
8 — ne | 
1 si Dieu existe 


Est-ce que A est décidable ? Pourquoi ? (la réponse ne dépend pas des convictions 
religieuses du lecteur). 


8.3 Indécidabilité 


Dans cette section, nous prouvons un des théorèmes les plus importants philoso- 
phiquement dans la théorie de la programmation : l’existence de problèmes qui ne sont 
pas décidables (1.e. indécidables). 


8.3.1 Premières considérations 


Observons tout d’abord, que cela peut s’établir simplement. 
Théorème 8.2 1l existe des problèmes de décision qui ne sont pas décidables. 


Démonstration: On a vu que l’on pouvait coder une machine de Turing par un 
mot fini sur l’alphabet Z — {0,1} : voir la définition Il y a donc un nombre 
dénombrable de machines de Turing. 

Par contre, il y a un nombre non dénombrable de langages sur l’alphabet Y — 
{0,1} : cela peut se prouver en utilisant un argument de diagonalisation comme dans 
le premier chapitre. 
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Il y a donc des problèmes qui ne correspondent à aucune machine de Turing (et il 
y en a même un nombre non dénombrable). 

Le défaut d’une preuve comme celle-là est évidemment qu’elle ne dit rien sur les 
problèmes en question. Est-ce qu’ils sont ésotériques et d’aucun intérêt sauf pour le 
théoricien ? 

Malheureusement, même des problèmes simples et naturels s’avèrent ne pas pou- 
voir se résoudre par algorithme. 


8.3.2 Est-ce grave ? 


Par exemple, dans l’un des problèmes indécidables, on se donne un programme 
et une spécification de ce que le programme est censé faire (par exemple trier des 
nombres), et l’on souhaite vérifier que le programme satisfait sa spécification. 

On pourrait espérer que le processus de la vérification puisse s’automatiser, c’est- 
à-dire que l’on puisse construire un algorithme qui vérifie si un programme satisfait sa 
spécification. Malheureusement, cela est impossible : le problème général de la vérifi- 
cation ne peut pas se résoudre par ordinateur. 

On rencontrera d’autres problèmes indécidables dans ce chapitre. Notre objectif est 
de faire sentir à notre lecteur le type de problèmes qui sont indécidables, et de com- 
prendre les techniques permettant de prouver qu’un problème ne peut pas être résolu 
informatiquement. 


8.3.3 Un premier problème indécidable 


On va utiliser un argument de diagonalisation, c’est-à-dire un procédé analogue à 
la diagonalisation de Cantor qui permet de montrer que l’ensemble des parties de N 
n’est pas dénombrable : voir le premier chapitre. 


Remarque 8.4 Derrière l’argument précédent sur le fait qu’il y a un nombre non dé- 
nombrable de langages sur l'alphabet Z = {0,1} se cachait déjà une diagonalisation. 
On fait ici une diagonalisation plus explicite, et constructive. 


On appelle langage universel, appelé encore problème de l'arrêt des machines de 
Turing , le problème de décision suivant : 


Définition 8.9 (HALTING-PROBLEM) 
Donnée: Le codage (M) d’une machine de Turing M et un mot w. 
Réponse: Décider si la machine M accepte le mot w. 


Remarque 8.5 On peut aussi voir ce problème de la façon suivante : on se donne une 
paire ((M),w), où (M) est le codage d’une machine de Turing M, et w est un mot, et 
l’on souhaite décider si la machine M accepte le mot w. 


Théorème 8.3 Le problème HALTING — PROBLEM n'est pas décidable. 


Démonstration: On prouve le résultat par un raisonnement par l’absurde. Suppo- 
sons que HALTING — PROBLEM soit décidé par une machine de Turing À. 
On construit alors une machine de Turing B qui fonctionne de la façon suivante : 
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— B prend en entrée un mot (C) codant une machine de Turing C'; 

— B appelle la machine de Turing À sur la paire {((C'), (C')) (c’est-à-dire sur l’en- 
trée constituée du codage de la machine de Turing C’, et du mot w correspondant 
aussi à ce même codage) ; 

— Si la machine de Turing À : 

— accepte ce mot, B refuse ; 
— refuse ce mot, B accepte. 
Par construction B termine sur toute entrée. 
On montre qu’il y a une contradiction, en appliquant la machine de Turing B sur le 
mot (B), c’est-à-dire sur le mot codant la machine de Turing B. 

— Si B accepte (B), alors cela signifie, par définition de HALTING — PROBLEM 
et de À, que À accepte ((B), (B)). Mais si À accepte ce mot, B est construit pour 
refuser son entrée (B). Contradiction. 

— Si B refuse (B), alors cela signifie, par définition de HALTING — PROBLEM 
et de À, que À refuse ({B),(B)). Mais si À refuse ce mot, B est construit pour 
accepter son entrée (B). Contradiction. 


8.3.4 Problèmes semi-décidables 


Le problème HALTING — PROBLEM est toutefois semi-décidable dans le sens 
suivant : 


Définition 8.10 (Langage semi-décidable) Un langage L C M* est dit semi-décidable 
s’il correspond à l’ensemble des mots acceptés par une machine de Turing M. 


Corollaire 8.1 Le langage universel HALTING — PROBLEM est semi-décidable. 


Démonstration: Pour savoir si on doit accepter une entrée qui correspond au co- 
dage (M) d’une machine de Turing M et au mot w, il suffit de simuler la machine de 
Turing M sur l'entrée w. On arrête la simulation et on accepte si l’on détecte dans cette 
simulation que la machine de Turing M] atteint un état accepteur. Sinon, on simule M 
pour toujours. 

Un langage semi-décidable est aussi dit récursivement énumérable. 

On note RE la classe des langages et des problèmes semi-décidables : voir la figure 


Corollaire 8.2 RC RE. 


Démonstration: L’inclusion est par définition. Puisque HALTING — PROBLEM est 
dans RE et n’est pas dans R, l’inclusion est stricte. 


8.3.5 Un problème qui n’est pas semi-décidable 


Commençons par établir le résultat fondamental suivant : 


Théorème 8.4 Un langage est décidable si et seulement s'il est semi-décidable et son 
complémentaire aussi. 
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langages quelconques 


langages semi-décidables 


langages décidables 


FIGURE 8.2 — Inclusions entre classes de langages. 


— Accepté ——+} Accepte 


— Accepté  ——— +} Refuse 


FIGURE 8.3 — Illustration de la preuve du théorème|8.4] 
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— Accepte |__, Refuse 
hole Refuse ee Accepte 


FIGURE 8.4 — Construction d’une machine de Turing acceptant le complément d’un 
langage décidable. 


Remarque 8.6 Ce résultat justifie la terminologie de semi-décidable, puisqu’un lan- 
gage qui est semi-décidable et dont le complémentaire l’est aussi est décidable. 


Démonstration: sens =. Supposons que L soit semi-décidable et son complé- 
mentaire aussi. Il existe une machine de Turing M; qui termine en acceptant sur L, 
et une machine de Turing M qui termine en acceptant sur son complémentaire. On 
construit une machine de Turing M qui, sur une entrée w, simule en parallèle] M et 
Mb, (c’est-à-dire que l’on simule t étapes de M; sur w, puis on simule t étapes de M2 
sur w, pour { = 1,2,---,) jusqu’à ce que l’une des deux termine : voir la figure|[8.3] Si 
M; termine, la machine de Turing M accepte. Si c’est M2, la machine M refuse. La 
machine de Turing M que l’on vient de décrire décide L. 

sens —. Par définition, un langage décidable est semi-décidable. En inversant dans 
la machine de Turing l’état d'acceptation et de refus, son complémentaire est aussi 
décidable (voir la figure[8.4) et donc aussi semi-décidable. 

On considère alors le complémentaire du problème HALTING — PROBLEM, 
que l’on va noter HALTING — PROBLEM. 


Définition 8.11 (HALTING — PROBLEM) 
Donnée: Le codage (M) d’une machine de Turing M et un mot w. 
Réponse: Décider si la machine M n'accepte pas le mot w. 


Corollaire 8.3 Le problème HALTING — PROBLEM n'est pas semi-décidable. 


Démonstration: Sinon, par le théorème précédent, le problème de décision HALTING — PROBLEM 
serait décidable. 


8.3.6 Sur la terminologie utilisée 


Un langage décidable est aussi appelé un langage récursif : la terminologie de 
récursif fait référence à la notion de fonction récursive : voir par exemple le cours 
qui présente la calculabilité par l'intermédiaire des fonctions récursives. 

La notion de énumérable dans récursivement énumérable s’explique par le résultat 
suivant. 


1. Une alternative est de considérer que M est une machine de Turing non-déterministe qui simule de 
façon non-déterministe soit M1 soit M2. 
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— Accepté ——+} Accepte 


— Accepté —— +}; Accepte 


FIGURE 8.5 — Construction d’une machine de Turing acceptant Li U Lo. 


Théorème 8.5 Un langage L C M* est récursivement énumérable si et seulement si 
l’on peut produire une machine de Turing qui affiche un à un (énumère) tous les mots 
du langage L. 


Démonstration: sens —. Supposons que L soit récursivement énumérable. Il 
existe une machine de Turing À qui termine en acceptant sur les mots de Z. 

L'ensemble des couples (t,w), où t est un entier, w est un mot, est dénombrable. 
On peut se convaincre assez facilement qu’il est en fait effectivement dénombrable : on 
peut construire une machine de Turing qui produit le codage (t, w) de tous les couples 
(t, w). Par exemple, on considère une boucle qui pour t — 1,2,--- jusqu’à l’infini, 
considère tous les mots w de longueur inférieure ou égale à #, et produit pour chacun 
le couple (t, w). 

Considérons une machine de Turing B qui en plus, pour chaque couple produit 
(t, w), simule en outre t étapes de la machine À. Si la machine À termine et accepte en 
exactement { étapes, B affiche alors le mot w. Sinon B n’affiche rien pour ce couple. 

Un mot du langage L, est accepté par À en un certain temps t. Il sera alors écrit par 
B lorsque celui-ci considérera le couple (t,w). Clairement, tout mot w affiché par B 
est accepté par À, et donc est un mot de Z. 

sens <=. Réciproquement, si l’on a une machine de Turing B qui énumère tous les 
mots du langage L, alors on peut construire une machine de Turing À, qui étant donné 
un mot w, simule B, et à chaque fois que B produit un mot compare ce mot au mot w. 
S’ils sont égaux, alors À s’arrête et accepte. Sinon, À continue à jamais. 

Par construction, sur une entrée w, À termine et accepte si w se trouve parmi les 
mots énumérés par B, c’est-à-dire si w € L. Si w ne se trouve pas parmi ces mots, par 
hypothèse, w & L, et donc par construction, À n’acceptera pas w. 


8.3.7 Propriétés de clôture 


Théorème 8.6 L'ensemble des langages semi-décidables est clos par union et par in- 
tersection : autrement dit, si L: et Là sont semi-décidables, alors Li U Lo et LiN Lo 
le sont. 


Démonstration: Supposons que L; corresponde à L(A;) pour une machine de 
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Turing À; et La à L(A2) pour une machine de Turing A2. Alors Li U L2 correspond à 
L(A) pour la machine de Turing À qui simule en parallèle A: et A2 et qui termine et 
accepte dès que l’une des deux machines de Turing À; et A2 termine et accepte : voir 
la figure[8.5] 

Li N L2 correspond à L(A) pour la machine de Turing À qui simule en parallèle 
A; et A2 et qui termine dès que les deux machines de Turing A; et A2 terminent et 
acceptent. 


Théorème 8.7 L'ensemble des langages décidables est clos par union, intersection, et 
complément : autrement dit, si Li et L2 sont décidables, alors Li U La, Li N Lo, et LS 
le sont. 


Démonstration: On a déjà utilisé la clôture par complémentaire : en inversant dans 
la machine de Turing l’état d'acceptation et de refus, le complémentaire d’un langage 
décidable est aussi décidable (voir la figure|[8.4). 

Il reste à montrer qu’avec les hypothèses, les langages Li U Z2 et Li N L2 sont 
décidables. Mais cela est clair par le théorème précédent et le fait qu’un ensemble est 
décidable si et seulement si il est semi-décidable et son complémentaire aussi, en utili- 
sant les lois de Morgan (le complémentaire d’une union est l’intersection des complé- 
mentaires, et inversement) et la stabilité par complémentaire des langages décidables. 


8.4 Autres problèmes indécidables 


Une fois que nous avons obtenu un premier problème indécidable, nous allons en 
obtenir d’autres. 


8.4.1 Réductions 


Nous connaissons deux langages indécidables, HALTING — PROBLEM et son 
complémentaire. Notre but est maintenant d’en obtenir d’autres, et de savoir comparer 
les problèmes. Nous introduisons pour cela la notion de réduction. 

Tout d’abord, nous pouvons généraliser la notion de calculable aux fonctions et pas 
seulement aux langages et problèmes de décision. 


Définition 8.12 (Fonction calculable) Soient Y et Y/ deux alphabets. Une fonction 
f:2* — Y'* (totale) est calculable s’il existe une machine de Turing À, qui travaille 
sur l'alphabet SU, telle que pour tout mot w, À avec l'entrée w, termine et accepte, 
avec f(w) écrit sur son ruban au moment où elle termine. 


On peut se convaincre facilement que la composée de deux fonctions calculables 
est calculable. 

Cela nous permet d’introduire une notion de réduction entre problèmes : l’idée est 
que si À se réduit à B, alors le problème À est plus facile que le problème B, ou si 
l’on préfère, le problème B est plus difficile que le problème À : voir la figure|8.6]et la 


figure|[8.7] 
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Instance du Instance du 
F., 
problème À problème B 


Algorithme >— oui 


non 


FIGURE 8.6 — Réduction du problème À vers le problème B. Si l’on peut résoudre le 
problème B, alors on peut résoudre le problème À. Le problème À est donc plus facile 
que le problème B, noté À <,, B. 


FAUX FAUX 


VRAI () VRAI 


Problème À Problème B 


FIGURE 8.7 - Les réductions transforment des instances positives en instances posi- 
tives, et négatives en négatives. 
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Définition 8.13 (Réduction) Soient À et B deux problèmes d’alphabet respectifs MA 
et MB. Une réduction de À vers B est une fonction f : M — M5 calculable telle 
que w € À ssi f(w) € B. On note À <» B lorsque À se réduit à B. 


Cela se comporte comme on le souhaite : un problème est aussi facile (et difficile) 
que lui-même, et la relation “être plus facile que” est transitive. En d’autres termes : 


Théorème 8.8 <,, est un préordre : 
LL L<m L; 
2. Li y Lo, Lo <m L3 impliquent Li mn L3. 


Démonstration: Considérer la fonction identité comme fonction f pour le premier 
point. 

Pour le second point, supposons Li < L2 via la réduction f, et Li < La via la 
réduction g. On à x € L; ssi g(f(x)) € Lo. I suffit alors de voir que go f, en temps 
que composée de deux fonctions calculables est calculable. 


Remarque 8.7 Il ne s’agit pas d’un ordre, puisque Li <ym Lo, L2 <m LA n'implique 
pas Li = Lo. Il est en fait naturel d'introduire le concept suivant : deux problèmes 
LA et L2 sont équivalents, noté Li = Lo, si Li <m Lo et Si Li <m L1. On a alors 
Li mn Lo, Lo <m Li impliquent Li = Lo. 


Intuitivement, si un problème est plus facile qu’un problème décidable, alors il est 
décidable. Formellement : 


Proposition 8.2 (Réduction) Si À <, B, et si B est décidable alors À est décidable 
Démonstration: À est décidé par la machine de Turing qui, sur une entrée w, cal- 


cule f(w), puis simule la machine de Turing qui décide B sur l’entrée f(w). Puisqu’on 
a w € À si et seulement si f(w) € B, la machine de Turing est correcte. 


Proposition 8.3 (Réduction) Si À <,, B, et si À est indécidable, alors B est indéci- 
dable. 


Démonstration: Il s’agit de la contraposée de la proposition précédente. 


8.4.2 Quelques autres problèmes indécidables 


Cette idée va nous permettre d’obtenir immédiatement la preuve de l’indécidabilité 
de plein d’autres problèmes. 

Par exemple, le fait qu’il n’est pas possible de déterminer algorithmiquement si une 
machine de Turing accepte au moins une entrée : 


Définition 8.14 (Problème L;) 
Donnée: Le codage (M) d'une machine de Turing M. 
Réponse: Décider si L(M) £ (. 
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— Accepté ——+}. Accepte 


Aw 


FIGURE 8.8 — Illustration de la machine de Turing utilisée dans la preuve de la propo- 
sition 


Proposition 8.4 Le problème Problème Ly est indécidable. 


Démonstration: On construit une réduction de HALTING — PROBLEM vers 
Lg : pour toute paire ((A),w), on considère la machine de Turing A, définie de la 
manière suivante (voir la figure|[8.8) : 

— À,, prend en entrée un mot u; 

— À, simule À sur w ; 

— Si À accepte w, alors A,, accepte. 
La fonction f qui à ({A), w) associe (A,,) est bien calculable. De plus on a ((A),w) € 
HALTING — PROBLEM si et seulement si L(A,) # 0, c’est-à-dire (A4) € Lg : en 
effet, À,, accepte soit tous les mots (et donc le langage correspondant n’est pas vide) 
si À accepte w, soit n’accepte aucun mot (et donc le langage correspondant est vide) 
sinon. 


Définition 8.15 (Problème L) 
Donnée: Le codage (A) d’une machine de Turing À et le codage (A') d'une ma- 
chine de Turing À’. 
Réponse: Déterminer si L(A) Z L(A'). 


Proposition 8.5 Le problème Problème L est indécidable. 


Démonstration: On construit une réduction de Ly vers L. On considère une ma- 
chine de Turing fixe B qui accepte le langage vide : prendre par exemple une machine 
de Turing B qui rentre immédiatement dans une boucle sans fin. La fonction f qui à 
(A) associe la paire (A, B) est bien calculable. De plus on a (A) € Ly si et seulement 
si L(A) 0 si et seulement si (A, B) € Lz. 


8.4.3 Théorème de Rice 


Les deux résultats précédents peuvent être vus comme les conséquences d’un ré- 
sultat très général qui affirme que toute propriété non triviale des algorithmes est indé- 
cidable. 


Théorème 8.9 (Théorème de Rice) Toute propriété non triviale des langages semi- 
décidables est indécidable. 
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. A Accepte 
Démarre 
ds 1 8 | Accepté —— +}; Accepte 
Aw 


FIGURE 8.9 -— Illustration de la machine de Turing utilisée dans la preuve du théorème 
de Rice. 


Autrement dit, soit une propriété P des langages semi-décidables non triviale, 
c’est-à-dire telle qu'il y a au moins une machine de Turing M telle que L(M\) satisfait 
P et une machine de Turing M telle que L(M) ne satisfait pas P. 

Alors le problème de décision Lp : 

Donnée: Le codage (M) d’une machine de Turing M ; 

Réponse: Décider si L(M) vérifie la propriété P ; 
est indécidable. 


Remarque 8.8 Remarquons que si une propriété P est triviale, LP est décidable tri- 
vialement : construire une machine de Turing qui ne lit même pas son entrée et qui 
accepte (respectivement : refuse). 


Démonstration: Il nous faut démontrer que le problème de décision LP est indé- 
cidable. 

Quitte à remplacer P par sa négation, on peut supposer que le langage vide ne 
vérifie pas la propriété P (prouver l’indécidabilité de L,, est équivalent à prouver l’in- 
décidabilité de son complémentaire). Puisque P est non triviale, il existe au moins une 
machine de Turing B avec L(B) qui vérifie P. 

On construit une réduction de HALTING — PROBLEM vers le langage Lp. Étant 
donnée une paire {({A),w), on considère la machine de Turing À., définie de la façon 
suivante (voir la figure|[8.9) : 

— À, prend en entrée un mot u ; 

— Sur le mot w, À,, simule À sur le mot w ; 

— Si À accepte w, alors À,, simule B sur le mot u : À, accepte si seulement si B 

accepte u. 

Autrement dit, À, accepte, si et seulement si À accepte w et si B accepte u. Si w 
est accepté par À, alors L(A,,) vaut L(B), et donc vérifie la propriété P. Si w n’est 
pas accepté par À, alors L(A,,) = (), et donc ne vérifie pas la propriété P. 

La fonction f qui à ((A),w) associe (A.,) est bien calculable. 


Exercice 8.2. Montrer que l’ensemble des codages des machines de Turing qui ac- 
ceptent tous les mots qui sont des palindromes (en acceptant possiblement d’autres 


136 CHAPITRE 8. CALCULABILITÉ 


entrées) est indécidable. 


8.4.4 Le drame de la vérification 


Autrement dit : 


Corollaire 8.4 1! n’est pas possible de construire un algorithme qui prendrait en en- 
trée un programme, et sa spécification, et qui déterminerait si le programme satisfait 
sa spécification. 


Et cela, en fait, même si l’on fixe la spécification à une propriété P (dès que la 
propriété P n’est pas triviale), par le théorème de Rice. 

Par les discussions du chapitre précédent, cela s’avère vrai même pour des systèmes 
extrêmements rudimentaires. Par exemple : 


Corollaire 8.5 1! n’est pas possible de construire un algorithme qui prendrait en en- 
trée la description d’un système, et sa spécification, et qui déterminerait si le système 
satisfait sa spécification. 


Et cela, en fait, même si l’on fixe la spécification à une propriété P (dès que la 
propriété P n’est pas triviale), et même pour des systèmes aussi simples que les ma- 
chines à 2-compteurs, par le théorème de Rice, et les résultats de simulation du chapitre 
précédent. 


8.4.5 Notion de complétude 


Notons que l’on peut aussi introduire une notion de complétude. 


Définition 8.16 (RE-complétude) Un problème À est dit RE-complet, si : 
1. il est récursivement énumérable ; 


2. tout autre problème récursivement énumérable B est tel que B <» À. 


Autrement dit, un problème RE-complet est maximal pour <;, parmi les pro- 
blèmes de la classe RE. 


Théorème 8.10 Le problème HALTING — PROBLEM est RE-complet. 


Démonstration: HALTING — PROBLEM est semi-décidable. Maintenant, soit 
L un langage semi-décidable. Par définition, il existe une machine de Turing À qui 
accepte L. Considérons la fonction f qui à w associe le mot ((A),w). On a w € Lsiet 
seulement si f(w) € HALTING — PROBLEM, et donc L <y, HALTING — PROBLEM. 


8.5. PROBLÈMES INDÉCIDABLES NATURELS 137 


8.5 Problèmes indécidables naturels 


On peut objecter que les problèmes précédents, relatifs aux algorithmes sont “arti- 
ficiels”, dans le sens où ils parlent de propriétés d’algorithmes, les algorithmes ayant 
eux-même été définis par la théorie de la calculabilité. 

Il est difficile de définir formellement ce qu’est un problème naturel, mais on peut 
au moins dire qu’un problème qui a été discuté avant l’invention de la théorie de la 
calculabilité est (plus) naturel. 


8.5.1 Le dixième problème de Hilbert 


C’est clairement le cas du dixième problème identifié par Hilbert parmi les pro- 
blèmes intéressants pour le 20ème siècle en 1900 : peut-on déterminer si une équation 
polynomiale à coefficients entiers possède une solution entière. 


Définition 8.17 (Dixième problème de Hilbert) 
Donnée: Un polynôme P € N[X:,:--,X,] à coefficients entiers. 
Réponse: Décider s’il possède une racine entière. 


Théorème 8.11 Le problème Dixième problème de Hilbert est indécidable. 


La preuve de ce résultat, due à Matiyasevich |[Matiyasevich, 1970] est hors de l’am- 


bition de ce document. 


8.5.2 Le problème de la correspondance de Post 


La preuve de l’indécidabilité du problème de la correspondance de Post est plus 
facile, même si nous ne la donnerons pas ici. On peut considérer ce problème comme 
“naturel”, dans le sens où il ne fait pas référence directement à la notion d’algorithme, 
ou aux machines de Turing : 


Définition 8.18 (Problème de la correspondance de Post) 
Donnée: Une suite (u1,v1),--- , (Un, Un) de paires de mots sur l'alphabet Y. 
Réponse: Décider cette suite admet une solution, c’est-à-dire une suite d'indices 
1,42," ; tm de {1,2,--- ,n} telle que 


is is tt Un © Vis Vis + Vi 


m° 


Théorème 8.12 Le problème Problème de la correspondance de Post est indécidable. 


8.5.3 Décidabilité/Indécidabilité de théories logiques 


Nous avons déjà présenté dans le chapitre[6| les axiomes de l’arithmétique de Ro- 
binson et les axiomes de Peano : on s’attend à ce que ces axiomes soient vérifiés sur les 
entiers, c’est-à-dire dans le modèle standard des entiers où l’ensemble de base est les 
entiers, et où l’on interprète + par l’addition, x par la multiplication, et s(x) par æ +1. 

Étant donnée une formule close sur une signature contenant les symboles, F est 
soit vraie soit fausse sur les entiers (c’est-à-dire dans le modèle standard des entiers). 
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Appelons théorie de l’arithmétique, l’ensemble Th(N) des formules closes F qui sont 
vraies sur les entiers. 
Les constructions du chapitre suivant prouvent le résultat suivant : 


Théorème 8.13 TA(N) n'est pas décidable. 


Démonstration: Nous prouvons dans le chapitre qui suit que T'A(N) n’est pas ré- 
cursivement énumérable. Il suffit d’observer qu’un ensemble décidable est récursive- 
ment énumérable, pour obtenir une contradiction à supposer T'h(N) décidable. 

On peut prouver (ce que l’on ne fera pas) que si l’on considère des formules sans 
utiliser le symbole de multiplication, alors la théorie correspondante est décidable. 


Théorème 8.14 On peut décider si une formule close F sur la signature (0, s,+,=) 
(ie. celle de Peano sans la multiplication) est satisfaite sur les entiers standards. 


On obtient aussi par ailleurs les résultats suivants : 


Théorème 8.15 Soit F une formule close sur la signature des axiomes de Peano. Le 
problème de décision consistant à déterminer si F peut se prouver à partir des axiomes 
de Peano est indécidable. 


Démonstration: Étant donné {((M}),w), où M est une machine et w un mot, nous 
montrons dans le chapitre qui suit comment produire une formule close sur la signa- 
ture de l’arithmétique telle que 


((M},w) € HALTING — PROBLEM & > € Th(N), 


où HALTING — PROBLEM est le complémentaire du problème de l’arrêt des ma- 
chines de Turing. 

Or, en fait, on peut se convaincre que le raisonnement que l’on utilise pour cela 
peut se formaliser avec Peano et se déduire des axiomes de Peano. 

On a donc en fait ((M),w) € HALTING — PROBLEM si et seulement si 7 se 
prouve à partir des axiomes de Peano. 

Cela donne une réduction du complémentaire du problème de l’arrêt des machines 
de Turing vers notre problème : la transformation qui à ({M),w) associe - se calcule 
bien facilement. Notre problème est donc indécidable, puisque le premier l’est. 

On peut prouver : 


Théorème 8.16 On peut décider si une formule close F sur la signature (0, s,+,=) 
(ie. celle de Peano sans la multiplication) est prouvable à partir des axiomes de Peano. 


8.6 Théorèmes du point fixe 


Les résultats de cette section sont très subtils, mais extrêmement puissants. 
Commençons par une version simple, qui nous aidera à comprendre les preuves. 


Proposition 8.6 11 existe une machine de Turing A* qui écrit son propre algorithme : 
elle produit en sortie (A*). 
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Autrement dit, il est possible d’écrire un programme qui affiche son propre code. 

C’est vrai dans tout langage de programmation qui est équivalent aux machines de 
Turing : 

En shell UNIX par exemple, le programme suivant 


x=’"y= "echo . | tr . "\47" *; echo "x=$ySx$y; $Sx"'; y='\echo 
"\47"\; echo "x=S$Sy$SxSy; $x" 

produit 

x="y= "echo . | tr . "\47" *; echo "x=$ySx$y; $x"'; y='\echo 


"\47"*; echo "x=$yS$x$y; $x" 


qui est une commande, qui exécutée, affiche son propre code. 

On appelle parfois de tels programme des quines, en l’honneur du philosophe 
Willard van Orman Quine, qui a discuté l’existence de programmes autoreproducteurs. 

Démonstration: On considère des machines de Turing qui terminent sur toute en- 
trée. Pour deux telles machines À et 4’, on note AA’ la machine de Turing qui est 
obtenue en composant de façon séquentielle A et 4’. Formellement, AA’ est la ma- 
chine de Turing qui effectue d’abord le programme de À, et puis lorsque À temine 
avec sur son ruban w, effectue le programme de 4’ sur l’entrée w. 

On construit les machines suivantes : 


1. Étant donné un mot w, la machine de Turing Print, termine avec le résultat w ; 


2. Pour une entrée w de la forme w — (X), où X est une machine de Turing, 
la machine de Turing B produit en sortie le codage de la machine de Turing 
Print, X, c’est-à-dire le codage de la machine de Turing obtenue en composant 
Print, et X. 


On considère alors la machine de Turing A* donnée par Print(8),B, c’est-à-dire 
la composition séquentielle des machines Print,z; et B. 

Déroulons le résultat de cette machine : la machine de Turing Print(s) produit en 
sortie (B). La composition par B produit alors le codage de Print(8,(B), qui est bien 
le codage de la machine de Turing A*. 

Le théorème de récursion permet des autoréférences dans un langage de program- 
mation. Sa démonstration consiste à étendre l’idée derrière la preuve du résultat précé- 
dent. 


Théorème 8.17 (Théorème de récursion) Soit t : M* x M* — M* une fonction 
calculable. Alors il existe une machine de Turing R qui calcule une fonction r : M* - 
M telle que pour tout mot w 


Son énoncé peut paraître technique, mais son utilisation reste assez simple. Pour 
obtenir une machine de Turing qui obtient sa propre description et qui l’utilise pour 
calculer, on a besoin simplement d’une machine de Turing T qui calcule une fonction & 
comme dans l’énoncé, qui prend une entrée supplémentaire qui contient la description 


Lo 


Lo 
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de la machine de Turing. Alors le théorème de récursion produit une nouvelle machine 
R qui opère comme T mais avec la description de (R) gravée dans son code. 
Démonstration: Il s’agit de la même idée que précédemment. Soit Tune machine 
de Turing calculant la fonction t : T prend en entrée une paire (u,w) et produit en 
sortie un mot t(u, w). 
On considère les machines suivantes : 


1. Étant donné un mot w, la machine de Turing Print, prend en entrée un mot u 
et termine avec le résultat (w, u) ; 


2. Pour une entrée w’ de la forme {(X),w), la machine de Turing B : 


(a) calcule ((Print,x, X),w), où Print(x,X désigne la machine de Turing 
qui compose Print,x) avec X ; 


(b) puis passe le contrôle à la machine de Turing T.. 


On considère alors la machine de Turing R donnée par Print,n,B, c’est-à-dire la 
machine de Turing obtenue en composant Print,n, avec B. 

Déroulons le résultat r(w) de cette machine À sur une entrée w : sur une entrée 
w, la machine de Turing Print(p) produit en sortie ({B),w). La composition par 
B produit alors le codage de ({Printp) B),w), et passe le contrôle à T. Ce dernier 
produit alors {((Print,p,B),w) = t((R),w) = r(w). 

On obtient alors : 


Théorème 8.18 (Théorème du point fixe de Kleene) Soit une fonction calculable qui 
à chaque mot (A) codant une machine de Turing associe un mot (A) codant une ma- 
chine de Turing. Notons A! = f(A). 

Alors il existe une machine de Turing A* tel que L(A*) = L(f(A*)). 


Démonstration: Considérons une fonction t : M* x M* — M* telle que t((A), x) 
soit le résultat de la simulation de la machine de Turing f(A) sur l’entrée x. Par le 
théorème précédent, il existe une machine de Turing À qui calcule une fonction r telle 
que r(w) = t((R),w). Par construction A* = R et f(A*) = f(R) ont donc même 
valeur sur w pour tout w. 


Remarque 8.9 On peut interpréter les résultat précédents en lien avec les virus in- 
Jormatiques. En effet, un virus est un programme qui vise à se diffuser, c’est-à-dire à 
s’autoreproduire, sans être détecté. Le principe de la preuve du théorème de récursion 
est un moyen de s’autoreproduire, en dupliquant son code. 


8.7 Plusieurs remarques 


8.7.1 Calculer sur d’autres domaines 


Nous avons introduit la notion d'ensemble décidable, récursivement énumérable, 
etc. pour les sous-ensembles de X*, et la notion de fonction (totale) calculable f : 
DAS 

On peut vouloir travailler sur d’autres domaines que les mots sur un alphabet donné, 
par exemple sur les entiers. Dans ce cas, il suffit de considérer que l’on code un entier 
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par son écriture en, disons, base 2 pour se ramener au cas d’un mot sur l’alphabet 
{0,1}. On peut aussi coder un entier par exemple en unaire, i.e. n par a” pour une 
lettre a sur un alphabet Y avec a € Y. 

Dans le cas général, pour travailler sur un domaine E, on fixe un codage des élé- 
ments de Æ sur un alphabet Y : on dit par exemple qu’un sous-ensemble S C E est 
récursivement énumérable (respectivement décidable), si le sous-ensemble des codages 
des mots de E est récursivement énumérable (resp. décidable). 

De même une fonction (totale) f : E — Fest dit calculable si la fonction qui passe 
du codage de e € E au codage de f € Fest calculable. 


Exemple 8.5 On peut coder ñ = (n1,...,nx) € N° par 


(R) = a bare 2 qe ol 
sur l'alphabet © = {a,b}. Une fonction f : N° — N est dite calculable si elle est 
calculable sur ce codage. 


Les notions obtenues de fonction calculable, ensemble décidable, semi-décidable, 
etc. ne dépendent pas du codage, pour les codages usuels (en fait techniquement dès 
que l’on passer d’un codage à un autre de façon calculable). 


8.7.2 Vision algébrique de la calculabilité 


Les notions de la calculabilité sont parfois introduites de façon algébrique, en par- 
lant de fonctions sur les entiers. 

En particulier, on peut introduire la notion de fonction partielle calculable, qui étend 
la notion de fonction calculable introduite au cas des fonctions non-totales. 


Définition 8.19 (Fonction partielle calculable) Soit f : E — F'une fonction, possi- 
blement partielle. 

La fonction f : E — F est calculable s’il existe une machine de Turing À telle que 
pour tout mot codage w d’un élement e € E dans le domaine de f, À avec l'entrée 
w, termine et accepte, avec le codage de f(e) écrit sur son ruban au moment où elle 
termine. 


Bien entendu, cette notion correspond à la notion précédente pour le cas d’une 
fonction f totale. 
On peut caractériser de façon purement algébrique la notion de fonction calculable : 


Définition 8.20 (Fonction récursive) Une fonction (possiblement partielle) f : N° — 
N est récursive si elle est soit la constante 0, soit l’une des fonctions : 
— Zero:xt 0 la fonction 0; 
— Succ:xH+ x +1 la fonction successeur ; 
— Proj;, : (d1,..., n) + à: les fonctions de projection, pour 1 <i<n; 
— Comp,,(g, h1,...,hun) : (d1,...,&n)  g(hi(a1,...,n),..., hm(t1,...,Tn)) 
la composition des fonctions récursives g, h1,...,hm; 
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— Rec(g, h) la fonction définie par récurrence comme 


Jet) = g(t2,...,n), 
PORT Las) shirts 


où get h sont récursives. 
— Min(g) la fonction qui à (x2,...,1,) associe le plus petit y € N tel que 


Ein) = 1 


s’il en existe (et qui n’est pas définie sinon) où g est récursive. 
Une fonction primitive récursive est une fonction qui se définit sans utiliser le 
schéma Min. 


On peut prouver le résultat suivant : 


Théorème 8.19 Une fonction f : N° — N est récursive si et seulement si elle est 
calculable par une machine de Turing. 


La notion d’ensemble décidable ou semi-décidable peut se définir aussi de façon 
algébrique : 


Théorème 8.20 Un sous-ensemble S C N est décidable si la fonction charactéristique 
1 sinesS 
0 singsS 


de $, i.e. la fonction (totale) x :nr { est calculable 


Théorème 8.21 Un sous-ensemble S C N est semi-décidable si la fonction (partielle) 
de 1 sine sS 
. indéfini singsS 


est calculable. 


Exercice 8.3. Prouver ces théorèmes. 


*Exercice 8.4. {Problème de l’arrêt généralisé] Soit À un sous-ensemble décidable 
de l’ensemble des codages de machines de Turing, tel que toutes les machines de A 
terminent toujours. 

Alors À est incomplet : il existe une fonction (unaire) f : N — N calculable totale 
qui n’est représentée par aucune machine de Turing de A. 

Expliquer pourquoi ce résultat implique le problème de l’arrêt. 


8.8 Exercices 


Exercice 8.5. Soit E C N un ensemble récursivement énumérable, énuméré par une 
Jonction calculable f strictement croissante. Montrer que E est décidable. 


Exercice 8.6. En déduire que tout sous-ensemble récursivement énumérable infini de 
N contient un ensemble décidable infini. 
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Exercice 8.7. Soit E C N un ensemble décidable. Montrer qu'il est énuméré par une 
Jonction calculable f strictement croissante. 


Exercice 8.8. Soit À C N°? un ensemble décidable de couples d’entiers. 
On note 2A pour la (première) projection de À, à savoir le sous-ensemble de N 
défini par 


JA = {x|1y € N tel que (x, y) € A}. 
1. Montrer que la projection d’un ensemble décidable est récursivement énumé- 
rable. 


2. Montrer que tout ensemble récursivement énumérable est la projection d’un en- 
semble décidable. 


Exercice 8.9. Un nombre réel a est dit récursif s’il existe des fonctions calculables 
F et G de N dans N telles que pour tout n > 0 on ait G(n) > Det 


F(n) 1 
Pr Re 
li- D I<; 
1. Montrer que tout nombre rationnel est récursif. 
2. Montrer que 12, T, € sont récursifs. 


3. Montrer que le nombre réel 0 < a < 1 est récursif si et seulement s’il existe 
un développement décimal récursif de a, c’est-à-dire une fonction calculable 
H :N — Ntelle que pour tout n > 0 on ait 0 < H(n) < 9er 


OO 


H(n 
jal — » es 


n=0 


4. Montrer que l’ensemble des réels récursifs forme un sous corps dénombrable de 
KR, tel que tout polynôme de degré impair possède une racine. 


5. Donner un exemple de réel non-récursif. 


Exercice 8.10. Un état “inutile” d’une machine de Turing est un état q € Q dans 
lequel on ne rentre sur aucune entrée. Formuler la question de savoir si une machine 


de Turing possède un état inutile comme un problème de décision, et prouver qu'il est 
indécidable. 


Exercice 8.11. Les problèmes suivants, où l’on se donne une machine de Turing À et 
l’on veut savoir 


1. si L(A) (le langage accepté par À) contient au moins deux entrées distinctes 
2. si L(A) accepte aucune entrée 


sont-ils décidables ? semi-décidables ? 
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8.9 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de [Sipser, 1997] et de [Hopcroft et al., 2001] en anglais, ou 
de |Wolper, 2001!, [Stern, 1994] [Carton, 2008] en français. 
Le livre [Sipser, 1997] est un excellent ouvrage très pédagogue. 
Bibliographie Ce chapitre contient des résultats standards en calculabilité. Nous 
nous sommes inspirés ici essentiellement de leur présentation dans les livres | Wolper, 20011, 


Carton, 2008], [Jones, 1997], |Kozen, 1997], IHopcroft et al., 2001], ainsi que dans 
ISipser, 1997]. 


Chapitre 9 


Incomplétude de l’arithmétique 


En 1931, Kurt Güdel a prouvé un résultat dont les conséquences philosophiques 
en science ont été révolutionnaires : il a ainsi prouvé que toute théorie suffisante pour 
capturer les raisonnements arithmétiques est nécessairement incomplète, c’est-à-dire 
telle qu’il existe des énoncés qui ne sont pas démontrables et dont la négation n’est pas 
non plus démontrable. 

Ce théorème est largement considéré comme l’un des plus grands achèvements des 
mathématiques et de la logique du 20ème siècle. 

Avec tous les ingrédients précédents, nous sommes en fait en position de com- 
prendre ce théorème et d’en donner une preuve complète. C’est l’objet de ce chapitre : 
enfin, nous donnerons la preuve complète due à Turing. Nous ne ferons qu’évoquer la 
preuve de Güdel, qui permet d’en dire plus. 


9.1 Théorie de l’arithmétique 


9.1.1 Axiomes de Peano 


La question à laquelle on s’intéresse est de tenter d’axiomatiser l’arithmétique, 
c’est-à-dire les propriétés des entiers. 

Nous avons déjà présenté dans le chapitre [6] les axiomes de l’arithmétique de Ro- 
binson et les axiomes de Peano : on s’attend à ce que ces axiomes soient vérifiés sur les 
entiers, c’est-à-dire dans le modèle standard des entiers où l’ensemble de base est les 
entiers, et où l’on interprète + par l’addition, x par la multiplication, et s(x) par & +1. 

Autrement dit, on s’attend à ce que ces axiomes possèdent au moins un modèle : le 
modèle standard des entiers. 

Étant donnée une formule close sur une signature contenant ces symboles, F est 
soit vraie soit fausse sur les entiers (c’est-à-dire dans le modèle standard des entiers). 
Appelons théorie de l’arithmétique, l'ensemble T'RA(N) des formules closes F qui sont 
vraies sur les entiers. 
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9.1.2 Quelques concepts de l’arithmétique 


Il est possible de prouver que de nombreux concepts de la théorie des nombres se 
définissent parfaitement à partir de ces axiomes. 
Par exemple, on peut exprimer les concepts suivants : 
— INTDIV (x, y, q,r) défini comme “q est le quotient et r le reste de la division 
euclidienne de x par y”. 
En effet, cela peut s’écrire par la formule : 


(T=qxy+TAT< y). 


— DIV(y, x) défini comme “y divise x”. En effet, cela peut s’écrire : 


2q INTDIV (x, y, q, 0). 
— EVEN(x) défini comme “x est pair”. En effet, cela peut s’écrire : 
DIV(2, x). 
— ODD(x) défini comme “x est impair”. En effet, cela peut s’écrire : 
—EVEN(x). 
— PRIME(x) défini comme “x est premier”. En effet, cela peut s’écrire : 
(x 2 2A Vy(DIV(y,x) = (y=1Vy=x))). 
- POWER2(x) défini comme “x est une puissance de 2". En effet, cela peut 


s’écrire : 


Vy((DIV (y, x) À PRIME(y)) = y = 2). 


9.1.3 La possibilité de parler des bits d’un entier 


On peut aussi écrire des formules comme BIT (x, y) signifiant que “y est une puis- 
sance de 2, disons 2, et le kème bit de la représentation binaire de l’entier x est 1”. 
Cela est plus subtil, mais possible. Cela s’écrit en effet : 


(POWER (y) A VaVr(INTDIV (x, y, q,r) = ODD(q))). 


L'idée est que si y satisfait la formule, alors y est une puissance de 2, et donc en 
binaire il s’écrit 10° pour un entier k. En divisant x par y, le reste de la division r sera 
les k bits de poids le plus faible de x, et le quotient q les autres bits de x, puisqu’on 
ax = q*y+r. En testant si q est impair, on “lit” le k + 1ème bit de x, soit le bit 
correspondant au bit à 1 dans l’entier y codant cette position. 
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9.1.4 Principe de la preuve de Güdel 


Kurt Güdel a prouvé le théorème d’incomplétude en construisant, pour n’importe 
quel système de preuve raisonnable, une formule © de l’arithmétique qui affirme sa 
propre non-prouvabilité dans le système : 


@ est vraie & @ n’est pas prouvable. (9.1) 


Tout système de preuve raisonnable est valide, et donc on doit avoir 


1) prouvable = 1 est vrai. (9.2) 


Alors @ doit être vraie, car sinon 


est fausse — best prouvable. (par (0.1}) 
= pest vraie. (par (9.2) 


La construction de @ est intéressante par elle même, car elle capture la notion d’auto- 
référence. 
On reviendra sur la construction de Güdel. 


9.2 Théorème d’incomplétude 


9.2.1 Principe de la preuve de Turing 


On va prouver le théorème d’incomplétude en utilisant une approche qui permet 
d’obtenir les principales conséquences du théorème, et qui est en fait due à Alan Turing. 

Cette approche est plus simple, et surtout nous avons maintenant tous les ingré- 
dients pour en faire une preuve complète, en utilisant les arguments de la calculabilité. 

L'idée est de se convaincre que dans l’arithmétique de Peano, ainsi que dans tout 
système “raisonnable” de preuve pour la théorie de l’arithmétique : 


Théorème 9.1 1. L'ensemble des théorèmes (formules closes prouvables) à partir 
des axiomes de Peano (ou de toute axiomatisation “raisonnable” des entiers) est 
récursivement énumérable. 


2. L'ensemble TR(N) des formules closes F vraies sur les entiers n’est pas récur- 
sivement énumérable. 


Par conséquent, les deux ensembles ne peuvent pas être les mêmes, et le système 
de preuve ne peut pas être complet. En clair : 


Corollaire 9.1 1! existe donc des formules closes vraies de Th(N) qui ne sont pas 
prouvables , ou dont la négation n’est pas prouvable à partir des axiomes de Peano, 
ou de toute axiomatisation “raisonnable” des entiers. 


C’est le premier théorème d’incomplétude de Kurt Güdel. 


Exercice 9.1. Comment concilier le théorème d’incomplétude précédent (de Güdel) 
avec le théorème de complétude (de Güdel) ? 
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9.2.2 Le point facile 


L'ensemble des théorèmes (formules closes prouvables à partir des axiomes de 
Peano) de l’arithmétique est certainement récursivement énumérable : quelle que soit 
la méthode de preuve (par exemple celle du chapitre [6}, on peut énumérer les théo- 
rèmes en énumérant les axiomes et en appliquant systématiquement toutes les règles 
de déduction dans toutes les façons possibles, en émettant toutes les formules closes 
qui peuvent être dérivées. 

Cela reste vrai dès que l’on suppose que l’on peut énumérer les axiomes de l’axio- 
matisation dont on part. C’est pourquoi, on peut dire que l’ensemble des théorèmes de 
toute axiomatisation raisonnable des entiers est récursivement énumérable. 


Remarque 9.1 Autrement dit, plus haut, si on veut une définition de “raisonnable”, il 


suffit de prendre “récursivement énumérable”. 


9.2.3 Lemme crucial 


Le point crucial est alors de prouver le résultat suivant. 


Lemme 9.1 L'ensemble TR(N) n'est pas récursivement énumérable. 


On prouve cela en réduisant le complémentaire HALTING — PROBLEM du pro- 
blème de l’arrêt HALTING — PROBLEM des machines de Turing à ce problème, i.e. 
en montrant que HALTING — PROBLEM <y» T'Rh(N). 

Le théorème découle alors : 

— du fait que HALTING — PROBLEM n’est pas récursivement énumérable ; 

— et du fait que si À <,, B et que si À n’est pas récursivement énumérable, alors 

B non plus. 

Rappelons que Lyniv est le problème suivant : on se donne ((M),w), et on veut 
déterminer si la machine de Turing M s’arrête sur l’entrée w. 

Étant donné ((M},w), nous montrons comment produire une formule close + sur 
la signature de l’arithmétique telle que 


((M},w) € HALTING — PROBLEM & y € Th(N). 


En d’autres termes, étant donné M et w, on doit construire une formule close sur 
la signature de l’arithmétique qui affirme que “la machine de Turing M ne s’arrête pas 
sur l’entrée w”’. 

Cela s’avère possible parce que le langage de l’arithmétique est suffisamment puis- 
sant pour parler des machines de Turing et du fait qu’elles s’arrêtent. 

En utilisant le principe de la formule BIT (y, x) précédent, on va construire une 
série de formules dont le point culminant sera une formule VALCOMP rw (y) qui dit 
que y est un entier qui représente une suite de configurations de M sur l’entrée w : en 
d’autres termes, y représente une suite de configurations Co, C1,--: , C4 de M, codée 
sur un certain alphabet Y telle que : 

— Co est la configuration initiale C[w] de M sur w ; 

— C;:1 est la configuration successeur de C;, selon la fonction de transition Ô de la 

machine de Turing M, pour à <t; 


9.2. THÉORÈME D’'INCOMPLÉTUDE 149 


— C; est une configuration acceptante. 
Une fois que l’on a réussi à écrire la formule VALCOMP mw(y), il est facile 
d'écrire que M ne s’arrête pas sur l’entrée x : la formule 7 s’écrit 


y VALCOMP mu (y): 


— 


Cela prouve la réduction, et donc termine la preuve du lemme, et donc prouve aussi 
le théorème, en rappellant que HALTING — PROBLEM n’est pas récursivement énu- 
mérable. 


9.2.4 Construction de la formule 


Il ne reste plus qu’à donner les détails fastidieux de la construction de la formule 
à partir de M et de w. Allons-y. 

Supposons que l’on encode les configurations de M sur un alphabet fini >, que l’on 
peut supposer sans perte de restriction de taille p, avec p premier. 

Chaque nombre possède une unique représentation en base p : on va utiliser cette 
représentation en base p plutôt que la représentation binaire, pour simplifier la discus- 
sion. 

Supposons que la configuration initiale de M sur w = a1a2 ::- a soit codée par 
l’entier dont les chiffres de l’écriture en base p soient respectivement qo@1@2 : : : @n : 
on utilise la représentation de la définition[7.4]pour représenter les configurations. 

Considérons que le symbole de blanc B est codé par le chiffre k en base p. 

Soit LEGAL l’ensemble des 6-uplets (a, b, c, d,e, f) de nombres en base p qui cor- 
respondent aux fenêtres légales pour la machine M : voir la notion de fenêtre légale du 
chapitre[7] Si l’on préfère, LEGAL est l’ensemble des 6-uplets (a, b, c, d, e, f) tels que 
si trois éléments de Y représentés respectivement par a, b et c apparaissent consécutive- 
ment dans une configuration C’, et si d,e, f apparaissent consécutivement aux mêmes 
emplacements dans la configuration C;,1, alors cela est cohérent avec la fonction de 
transition Ô de la machine de Turing M. 

On définit maintenant quelques formules : 

— POWER, (x) : “Le nombre x est une puissance de p” : ici p est un nombre 

premier fixé. Cela s’écrit : 


Vy((DIV(y, x) À PRIME(y)) = y = p). 


— LENGTH, (v, d) : “Le nombre d est une puissance de p qui donne (un majorant 
de) la longueur de v vu comme un mot sur l’alphabet X à p lettres”. Cela s’écrit : 


(POWER, (d) À v < d). 


— DIGIT, (v, y, b) : “Le pème chiffre de v à la position y est b (y est donné par une 
puissance de p})”. Cela s’écrit : 


Zuda(v = a +bxy+uxpxyAa<yA\b< bp). 


— 3DIGIT(v, y, b, c, d) : “Les 3 chiffres de v à partir de la position y sont b, c et d 
(y est donné par une puissance de p)”. Cela s’écrit : 


Juda(v = a+bxy+cxpxy+dxpxpxy+uxpxpxpxyAa < yAb < pAc < pAd < p). 
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— MATCH(v, y, 2) : “Les 3 chiffres de v à la position y sont b, c et d et corres- 
pondent aux 3 chiffres de v à la position z selon la fonction de transition à de la 
machine de Turing (y et z sont donnés par une puissance de p)”. Cela s’écrit : 


3DIGIT (v, y, a, b,c) À 3DIGIT(v, z, d,e, f). 
(a,b,c,d,e,f)eLEGAL 


Remarque 9.2 On note évidemment ici, Nabicyde PELEGAL pour la conjonc- 
tion pour chacun des 6-uplets de LEGAL. 

— MOVE{(v, c, d) : “la suite v représente une suite de configurations successives de 
M de longueur c jusqu’à d : toutes les paires de suites de 3-chiffres exactement 
écartés de c positions dans v se correspondent selon 6”. Cela s’écrit : 


Vy((POWER, (y) À y *p*xpxc< d) = MATCH(v, y, yc)). 


— START (v, c) : “la suite v débute avec la configuration initiale de M sur l’entrée 
W = &ja2 ::* an auxquelles on a ajouté des blancs B jusqu’à la longueur c (cest 
donné par une puissance de p; n,p°,0 < à < n sont des constantes fixées qui ne 
dépendent que de 17)”. Cela s’écrit : 


/\ DIGIT, (v, p',a)Ap" < cAWy(POWER, (y)p" < y < c = DIGIT, (v,y, B)). 
i=0 


— HALT(v, d) : “La suite v possède un état d’arrêt quelque part”. Cela s’écrit : 


Jy(POWER, (y) A y < d A DIGIT, (v, y, a)). 


— VALCOMP ww (v) : “La suite v est un calcul de M valide sur w”’. Cela s’écrit : 


2c3d (POWER, (c)Ac < dALENGTH, (v, d)ASTART (v, c)AMOVE(v, c, d)AHALT(v, d)). 


— 7:“La machine M ne s’arrête pas sur w”. Cela s’écrit : 


dv VALCOMP ww (v). 


Notre preuve est terminée. 


*Exercice 9.2. Le défaut des constructions précédentes est qu’elle permettent d’afjir- 
mer qu'il existe des formules vraies mais non-prouvables, mais sans donner le moindre 
exemple de fonction non-prouvable. 

Utiliser les théorèmes de point fixe de la calculabilité (chapitre précédent) pour 
donner explicitement une formule 4 qui n’est pas prouvable. 


On verra plus loin que le second théorème de Güdel permet de faire encore mieux, 
et de prouver que l’on peut prendre 4 comme la formule qui affirme que la théorie est 
cohérente. 

(la solution de l’exercice précédent produisant une formue 1 dont l’interprétation 
n ’est pas claire). 
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9.3 La preuve de Gôüdel 


Kurt Güdel a en fait prouvé son théorème d’incomplétude d’une autre façon, en 
construisant une formule close qui affirme sa propre non-prouvabilité. Notons + pour 
prouvable, et H pour vrai respectivement sur les entiers. 

Supposons que l’on ait fixé un codage des formules par les entiers d’une façon 
raisonnable : si o est une formule, alors (D) désigne son codage (un entier). 


9.3.1 Lemme de point fixe 


Voici un lemme qui a été prouvé par Güdel, et qui ressemble fort aux théorèmes de 
point fixe déjà évoqués dans le chapitre précédent. 


Lemme 9.2 (Lemme de point fixe de Güdel) Pour toute formule (x) avec la variable 
libre x, il y a une formule close T telle que 


Free d({r)), 


ie. les formules closes T et W({T)) sont prouvablement équivalentes dans l’arithmé- 
tique de Peano. 


Démonstration: Soit x9 une variable fixée. On peut construire une formule SUBST (x, y, z) 
avec les variables libres x, y, z qui affirme “le nombre z est le codage d’une formule 
obtenue en substituant la constante dont la valeur est x dans toutes les occurrences de 
la variable libre x dans la formule dont le codage est y”. 

Par exemple, si #(x0) est une formule qui contient une occurrence libre de 5, mais 
aucune autre variable libre, la formule SUBST(7, (p(xo)),312) est vraie si 312 — 
(b(7)). 

On ne donnera pas les détails de la construction de la formule SUBST, mais l’idée 
est simplement d’observer que cela est bien possible, en utilisant par exemple l’idée de 
la relation BIT (x, y). 

On considère maintenant o(x) définie par Vy (SUBST(x,x,y) = #Y(y)), et T 
définie par o((o(xo))). 

Alors 7 est la solution recherchée car 


o((a(xo))) 

Vy (SUBST((o(x0)), (o(xo)), y) = Y{y)) 
Vy y = (o({(o(xo)))) = Y(y) 

Vy y = (T) = (y) 

d((T)) 


Bien entendu, on a utilisé ici des équivalences informelles, mais l’argument peut bien 
se formuler dans l’arithmétique de Peano. 


T 


TT 


9.3.2 Arguments de Güdel 


On observe maintenant que le langage de l’arithmétique est suffisamment puissant 
pour parler de prouvabilité en arithmétique de Peano. En particulier, il est possible de 
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coder une suite de formules par des entiers et d’écrire une formule PROOF (x, y) qui 
signifie que la suite de formules dont le codage est x est une preuve de la formule dont 
le codage est y. 

En d’autres termes, + PROOF({x), (#)) & 7 est une preuve de & dans l’arithmé- 
tique de Peano. 

La prouvabilité dans l’arithmétique de Peano se code alors par la formule PROVABLE(y) 
définie par 47 PROOF (x, y). 

Alors pour toute formule close 6, 


+ HE PROVABLE(()). (9.3) 


On a alors : 


+#&t+ PROVABLE((b)). (9.4) 


La direction — est vraie car si d est prouvable, alors il y a une preuve x de ®. 
L’arithmétique de Peano et le système de preuve permettent d’utiliser cette preuve pour 
prouver ® (i.e. que PROOF({x), (d))). La direction = découle def9.3]est de la validité 
de la preuve dans l’arithmétique de Peano. 

Utilisons alors le lemme de point fixe à la formule close -PROVABLE(x). On 
obtient une formule close p qui affirme sa propre non-prouvabilité : 


+ p& - PROVABLE((p)), 
en d’autres termes, p est vraie si et seulement si elle n’est pas prouvable dans l’arith- 


métique de Peano. 
Par validité de la preuve dans l’arithmétique de Peano, on a 


= p& - PROVABLE((p)). (9.5) 


Alors la formule p doit être vraie, puisque sinon, alors 


E-p = PROVABLE((p)) (par(o.5) 
æ Fp (par(9.3} 


= Ep (par validité de A. de Peano) 


une contradiction. 
Donc = p. Mais maintenant, 


Ep = -PROVABLE((p)) (par(0.5) 
=> bp (par définition de la vérité) 


> Wp (parP:3} 


Donc p est vraie, mais n’est pas prouvable. 
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9.3.3 Second théorème d’incomplétude de Gôdel 


Le défaut de la preuve précédente est bien entendu qu’elle ne donne pas un grand 
sens à la formule p. 

Le second théorème d’incomplétude de Kurt Güdel donne un exemple explicite de 
formule non prouvable. 

On peut exprimer une formule CONSIST qui exprime le fait que la théorie est 
cohérente. On écrit qu’il n’est pas possible de prouver une formule Fet sa négation : il 
suffit d'écrire -x(PROVABLE(x)APROVABLE(y)ANEG!{(x, y)), où NEG(x, y) 
signifie que y est le codage de la négation de la formule codée par x. 

Le second théorème d’incomplétude de Güdel permet de prouver que cette formule 
précise n’est pas prouvable. 

Autrement dit : 


Théorème 9.2 (Second théorème d’incomplétude de Gôüdel) Aucun système de dé- 
duction cohérent ne peut prouver sa propre cohérence. 


Nous ne rentrerons pas plus dans les détails. 


9.4 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 
nous suggérons la lecture des derniers chapitres de [Kozen, 1997}, qui reste courts et 
directs, ou de l’ouvrage [Cori and Lascar, 1993b] pour une preuve complète. 


Bibliographie Ce chapitre est repris des trois derniers chapitres de l’excellent livre 


[Kozen, 1997]. 
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Chapitre 10 


Bases de l’analyse de complexité 
d’algorithmes 


Les discussions précédentes ont fait intervenir l’existence ou non d’algorithmes 
pour résoudre un problème donné, mais en ignorant un aspect pourtant essentiel en 
pratique : les ressources nécessaires à son exécution, c’est-à-dire par exemple le temps 
ou la mémoire nécessaire sur la machine pour l’exécuter. 


L'objectif du chapitre suivant est de se focaliser sur l’une des ressources : le temps 
de calcul. Dans le chapitre qui suit, nous évoquerons d’autres ressources comme l’es- 
pace mémoire. On pourrait parler du temps parallèle, c’est-à-dire du temps sur une 
machine parallèle, etc. 


Commençons toutefois par bien comprendre la différence entre le cadre des cha- 
pitres qui suivent et les chapitres précédents : dans les chapitres précédents, on parlait 
de calculabilité, c’est-à-dire que l’on se posait la question de l’existence (ou de la 
non-existence) de solutions algorithmiques à des problèmes donnés. On va maintenant 
parler de complexité : c’est-à-dire que l’on se focalise maintenant uniquement sur des 
problèmes décidables, pour lesquels on connaît un algorithme. La question que l’on se 
pose maintenant est de comprendre s’il existe un algorithme efficace. 


Cela nous mène tout d’abord à préciser ce que l’on a envie d’appeler efficace, et 
comment on mesure cette efficacité. Toutefois, avant, il faut que notre lecteur ait les 
idées au clair sur ce que l’on appelle la complexité d’un algorithme, ou la complexité 
d’un problème, ce qui n’est pas la même chose. 


Remarque 10.1 Même si nous évoquons les complexités en moyenne dans ce chapitre, 
nous n’en aurons pas besoin à aucun moment dans les chapitres qui suivent : nous 
le faisons surtout pour expliquer pourquoi elles sont peu utilisées pour ces types de 
problèmes. 
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10.1 Complexité d’un algorithme 


On considère donc typiquement dans ce chapitre un problème P pour lequel on 
connaît un algorithme À : cet algorithme, on sait qu’il est correct, et qu’il termine. Il 
prend en entrée une donnée d, et produit un résultat en sortie A(d) en utilisant certaines 
ressources (on ne parle donc plus que de problèmes décidables). 


Exemple 10.1 Le problème P peut par exemple être celui de déterminer si un nombre 
v est parmi une liste de n nombres. 


Il est clair que l’on peut bien construire un algorithme À pour résoudre ce pro- 
blème : par exemple, 

— on utilise une variable res que l’on met à D; 

— on parcourt la liste, et pour chaque élément : 

— on regarde si cet élément est le nombre v : 
— sic’est le cas, alors on met la variable res à 1 

— à l’issue de cette boucle, on retourne res. 

Cet algorithme n’est pas le plus efficace que l’on puisse envisager. D’une part, on 
pourrait s’arrêter dès que l’on a mis res à 1, puisqu’on connaît la réponse. D'autre 
part, on peut clairement faire tout autrement, et utiliser par exemple une recherche par 
dichotomie (un algorithme récursif), si l’on sait que la liste est triée. 


10.1.1 Premières considérations 


On mesure toujours l'efficacité, c’est-à-dire la complexité, d’un algorithme en terme 
d’une mesure élémentaire u à valeur entière : cela peut être le nombre d’instructions 
effectuées, la taille de la mémoire utilisée, ou le nombre de comparaisons effectuées, 
ou toute autre mesure. 

Il faut simplement qu’étant donnée une entrée d, on sache clairement associer à l’al- 
gorithme À sur l’entrée d, la valeur de cette mesure, notée 1(4, d) : par exemple, pour 
un algorithme de tri qui fonctionne avec des comparaisons, si la mesure élémentaire 
Lu est le nombre de comparaisons effectuées, 1(4, d) est le nombre de comparaisons 
effectuées sur l’entrée d (une liste d’entiers) par l’algorithme de tri À pour produire le 
résultat A(d) (cette liste d’entiers triée). 

La fonction (A, d) dépend de À, mais aussi de l’entrée d. La qualité d’un algo- 
rithme À n’est donc pas un critère absolu, mais une fonction quantitative 1(,4,.) des 
données d’entrée vers les entiers. 


10.1.2 Complexité d’un algorithme au pire cas 


En pratique, pour pouvoir appréhender cette fonction, on cherche souvent à évaluer 
cette complexité pour les entrées d’une certaine faille : il y a souvent une fonction 
taille qui associe à chaque donnée d’entrée d, un entier taille(d), qui correspond à 
un paramètre naturel. Par exemple, cette fonction peut être celle qui compte le nombre 
d’éléments dans la liste pour un algorithme de tri, la taille d’une matrice pour le calcul 
du déterminant, la somme des longueurs des listes pour un algorithme de concaténation. 
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Pour passer d’une fonction des données vers les entiers, à une fonction des entiers 
(les tailles) vers les entiers, on considère alors la complexité au pire cas : la complexité 
(4, n) de l'algorithme À sur les entrées de taille n est définie par 


(An) = , Max H(A, à). 
d entrée avec taille(d)=n 


Autrement dit, la complexité u(.A,n) est la complexité la pire sur les données de 
taille n. 

Par défaut, lorsqu'on parle de complexité d’algorithme en informatique, il s’agit de 
complexité au pire cas, comme ci-dessus. 

Si l’on ne sait pas plus sur les données, on ne peut guère faire plus que d’avoir cette 
vision pessimiste des choses : cela revient à évaluer la complexité dans le pire des cas 
(le meilleur des cas n’a pas souvent un sens profond, et dans ce contexte le pessimisme 
est de loin plus significatif). 


10.13 Complexité moyenne d’un algorithme 


Pour pouvoir en dire plus, il faut en savoir plus sur les données. Par exemple, 
qu’elles sont distribuées selon une certaine loi de probabilité. 

Dans ce cas, on peut alors parler de complexité en moyenne : la complexité moyenne 
(4, n) de l'algorithme À sur les entrées de taille n est définie par 


u(A,n) = E[u(A, d)|d entrée avec taille(d) = n], 


où E désigne l’espérance (la moyenne). 


Si l’on préfère, 


H(Ain) = > r(d)u(A, d), 


d entrée avec taille(d)=n 


où 7(d) désigne la probabilité d’avoir la donnée d parmi toutes les données de taille n. 

En pratique, le pire cas est rarement atteint et l’analyse en moyenne peut sembler 
plus séduisante. 

Mais, d’une part, il est important de comprendre que l’on ne peut pas parler de 
moyenne sans loi de probabilité (sans distribution) sur les entrées. Cela implique que 
l’on connaisse d’autre part la distribution des données en entrée, ce qui est très sou- 
vent délicat à estimer en pratique. Comment anticiper par exemple les listes qui seront 
données à un algorithme de tri par exemple ? 

On fait parfois l'hypothèse que les données sont équiprobables (lorsque cela a un 
sens, comme lorsqu'on trie n nombres entre 1 et n et où l’on peut supposer que les 
permutations en entrée sont équiprobables), mais cela est est parfois arbitraire, et pas 
totalement justifiable. 

Et enfin, comme nous allons le voir sur quelques exemples, les calculs de com- 
plexité en moyenne sont plus délicats à mettre en œuvre. 
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10.2 Complexité d’un problème 


On peut aussi parler de la complexité d’un problème : cela permet de discuter de 
l’optimalité ou non d’un algorithme pour résoudre un problème donné. 

On fixe un problème P : par exemple celui de trier une liste d’entiers. Un algorithme 
À qui résout ce problème est un algorithme qui répond à la spécification du problème 
P : pour chaque donnée d, il produit la réponse correcte A(d). 

La complexité du problème P sur les entrées de taille n est définie par 


u(P,n) = inf max (A, d). 
A algorithme qui résout ? 4 entrée avec taille(d)=n 


Autrement dit, on ne fait plus seulement varier les entrées de taille n, mais aussi 
l'algorithme. On considère le meilleur algorithme qui résout le problème. Le meilleur 
étant celui avec la meilleure complexité au sens de la définition précédente, et donc au 
pire cas. C’est donc la complexité du meilleur algorithme au pire cas. 

L'intérêt de cette définition est le suivant : si un algorithme À possède la complexité 
u(P,n), c’est-à-dire est tel que H(A,n) = u(P,n) pour tout n, alors cet algorithme 
est clairement optimal. Tout autre algorithme est moins performant, par définition. Cela 
permet donc de prouver qu’un algorithme est optimal. 


10.3 Exemple : Calcul du maximum 


Nous allons illustrer la discussion précédente par un exemple : le problème du 
calcul du maximum. Ce problème est le suivant : on se donne en entrée une liste 
d’entiers naturels e1,62,-::,e,, avec n > 1, et on cherche à déterminer en sortie 
M = maxi<s<n e;, c’est-à-dire le plus grand de ces entiers. 


10.3.1 Complexité d’un premier algorithme 


En considérant que l’entrée est rangée dans un tableau, la fonction Java suivante 
résout le problème. 


static int max(int T[]) { 
int | = T.length —]; 
int M= T{l]; 
1 = 1-1]; 
while (1 >0) { 
if M<TIIJ) M=TII|; 
1 = 1-1]; 
} 
return M; 


} 


Si notre mesure élémentaire /: correspond au nombre de comparaisons, nous en 
faisons 2 par itération de la boucle, qui est exécutée n — 1 fois, plus 1 dernière du type 
t > 0 lorsque ! vaut 0. Nous avons donc (A, n) = 2n — 1 pour cet algorithme À, où 
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n est la taille de l’entrée, c’est-à-dire le nombre d’entiers dans la liste e1,e2,--: ,en. 
Ce nombre est indépendant de la donnée d, et donc u(A,n) = 2n — 1. 

Par contre, si notre mesure élémentaire 1 correspond au nombre d’affectations, 
nous en faisons 3 avant la boucle while. Chaque itération de la boucle effectue soit 1 
ou 2 affectations suivant le résultat du test M<T{1]. On a donc pour une entrée d de 
taille n, n +2 < p(A,d) < 2n + 1 : la valeur minimum est atteinte pour une liste 
ayant son maximum dans son dernier élément, et la valeur maximum pour une liste 
sans répétition triée dans l’ordre décroissant. Cette fois 1(4, d) dépend de l’entrée d. 
La complexité au pire cas est donnée par u(A,n) = 2n. 


10.3.2 Complexité d’un second algorithme 


Si l’entrée est rangée dans une liste, définie par exemple par 


class List { 
int val ; // L'élément 
List next ; // La suite 


List (int val, List next) { 
this.val = val ; this.next = next ; 


la fonction suivante résout le problème. 


static int max(List a) { 
int M = a.val; 
for (a = a.next; a Æ null; a = a.next) { 
if (a.val > M) 
M = a.val;} 
return M; 


Si notre mesure élémentaire y correspond au nombre de comparaisons entre entiers 
(nous ne comptons pas les comparaisons entre variables de type référence sur le type 
List) nous en faisons 1 par itération de la boucle, qui est exécutée n — 1 fois, soit au 
total n — 1. 

La complexité (A, n) de cet algorithme À sur les entrés de taille n est donc n — 1. 


10.3.3 Complexité du problème 


On peut se poser la question de savoir s’il est possible de faire moins de n — 1 
telles comparaisons : la réponse est non, à condition de se limiter aux algorithmes 
qui fonctionnent seulement par comparaisons||] En effet, cet algorithme est optimal en 
nombre de comparaisons. 


1. Si les entrées sont des entiers et que l’on s’autorise de l’arithmétique, il peut peut-être être possible de 
limiter les comparaions. On ne discutera pas ce type d’algorithmes ici. 
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En effet, considérons la classe C des algorithmes qui résolvent le problème de la 
recherche du maximum de n éléments en utilisant comme critère de décision les com- 
paraisons entre éléments, avec les hypothèses plus haut. 

Commençons par énoncer la propriété suivante : tout algorithme À de C est tel que 
tout élément autre que le maximum est comparé au moins une fois avec un élément qui 
lui est plus grand. 

En effet, soit à, le rang du maximum M retourné par l’algorithme sur une liste 
L=e;.e2.-.. en: ej, = M = maxi<i<, €. Raisonnons par l’absurde : soit jo Æ to 
tel que e;, ne soit pas comparé avec un élément plus grand que lui. L’élément e;, n’a 
donc pas été comparé avec e;, le maximum. 

Considérerons la liste L/ — e,.e2.--: ej0—1-M + 1.641: .e, obtenue à partir 
de L en remplaçant l’élément d’indice ÿ9 par M+1. 

L’algorithme À effectuera exactement les mêmes comparaisons sur L et L', sans 
comparer L'[j0] avec L’[is] et donc retournera L/[iç], ce qui est incorrect. D’où une 
contradiction, qui prouve la propriété. 

Il découle de la propriété qu’il n’est pas possible de déterminer le maximum de 
n-éléments en moins de n — 1 comparaisons entre entiers. Autrement dit, la complexité 
du problème P du calcul du maximum sur les entrées de taille n est u(P,n) = n — 1. 

L’algorithme précédent fonctionnant en n — 1 telles comparaisons, il est optimal 
pour cette mesure de complexité. 


10.3.4 Complexité de l’algorithme en moyenne 


Si notre mesure élémentaire y correspond au nombre d’affectations à l’intérieur de 
la boucle for, on voit que ce nombre dépend de la donnée. 

On peut s'intéresser à sa complexité en moyenne : il faut faire une hypothèse sur la 
distribution des entrées. Supposons que les listes en entrée dont on cherche à calculer 
le maximum sont des permutations de {1,2,--- ,n}, et que les n! permutations sont 
équiprobables. 

On peut montrer que la com- 
plexité moyenne sur les entrées de taille n pour cette mesure élémentaire y est alors 
donnée par H,, le nième nombre harmonique : H} = 1 + à + 3 +. J. H,, est de 
l’ordre de log n lorsque n tend vers l’infini. 

Cependant, le calcul est technique, et serait laborieux dans le cadre seul de ce cours. 

Simplifions, en nous intéressons à un problème encore plus simple : plutôt que de 
rechercher le maximum dans la liste e1,e2,--: ,e,, avec n > 1, donnons nous une 
liste d’entiers de {1,2,...,k} et un entier 1 < v < k, et cherchons à déterminer s’il 
existe un indice 1 < à < n avec e; = v. 

L’algorithme suivant résout le problème. 


static boolean trouve(int[] T, int v}) { 
for (int i = 0; i < T.length; i++) 
if (T[i] == v) 
return true; 
return false; 
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Sa complexité au pire cas en nombre d’instructions élémentaires est linéaire en n, 
puisque la boucle est effectuée n fois dans le pire cas. 

Observons que les listes en entrée sont des fonctions de {1,2,...,n}dans {1,2,...,k}, 
que l’on appellera tableau. Supposons que chacun des tableaux est choisi de façon 
équiprobable. 

Remarquons qu’il y a k” tableaux. Parmi ceux-ci, (k — 1)" ne contiennent pas 
l’élément v et dans ce cas, l’algorithme procède à exactement n itérations. Dans le 
cas contraire, l’entier est dans le tableau et sa première occurrence est alors à avec une 
probabilité de 

( k — et 
ki 
et il faut alors procéder à 1 itérations. Au total, nous avons une complexité moyenne de 


__(&—1)" ns (k—1)t 


Fe 1+x"(nx -n—1) 
i—1 
Va, Six L TPE 


: z F z 2, n j _ dpt 
(il suffit pour établir ce résultat de dériver 1,2, 2° = —— 


cn (M2) (2) 


10.4 Asymptotiques 


)et donc 


10.41 Complexités asymptotiques 


On le voit sur l'exemple précédent, réaliser une étude précise et complète de com- 
plexité est souvent fastidieux, et parfois difficile. Aussi, on s’intéresse en informatique 
plutôt à l’ordre de grandeur (l’asymptotique) des complexités quand la taille n des 
entrées devient très grande. 


10.42 Notations de Landau 


Comme il en est l’habitude en informatique, on travaille souvent à un ordre de 
grandeur près, via les notations ©. Rappelons les définitions suivantes : 


Définition 10.1 (Notation ©) Soient f et g deux fonctions f,g : N — R?°. On note 
f(n) = O(g(n)) lorsqu'il existe des entiers c et no tel que pour tout n > no, 


f{n) < cg(n). 


Intuitivement, cela signifie que f est inférieur à g à une constante multiplicative 
près, pour les instances (données) de tailles suffisamment grandes. 
De même on définit : 
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Définition 10.2 (Notations o, (, @) Soient f et g deux fonctions f,g : N — R??. 
— On note f(n) = o(g(n)) lorsque pour tout réel c, il existe un entier no tels que 
pour tout n > no, 
fn) < cg(n). 
— On note f(n) = Q{g(n)) lorsqu'il existe des entiers c et no tels que pour tout 
n > no, 
cg(n) < f(n). 
(on a dans ce cas 9 = O(f)) 
— On note f(n) = 8(g(n)) lorsque f(n) = O(g(n)) et F(n) = A(g(n)). 


Exercice 10.1. Soient f et g deux fonctions telles que 


f(n) 


nc g(n) 


existe et vaut un nombre c > 0. Prouver que f(n) = @(g(n)). 


Exercice 10.2. Prouver : 
— Si f = O(g) et g = O(h) alors f = O(h). 
— Si f = Q(g) et g = Q(h) alors f = O(h). 
— Si f = O(g) et g = G(h) alors f = O(h). 


Exercice 10.3. Donner des exemples d’algorithmes respectivement de compléxité : 
— linéaire 
— O(nlogn) 
— cubique 
— non-polynomial 


Exercice 10.4. Supposons que l’on a des algorithmes avec les temps listés plus bas 
(en supposant que ce sont des temps exacts). De combien est ralentit ces algorithmes 
lorque l’on (a) double la taille de l'entrée, (b) augmente la taille de l’entrée de 1. 


1. rm 
n3 
. 100n? 
. nlogn 


27 


Un À & D 


10.5 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture du polycopié du cours INF421, ou de de l’ouvrage [Kleinberg and Tardos, 2005], 


et en particulier de ses premiers chapitres. 


Bibliographie Le texte de ce chapitre est repris du texte que nous avions écrit dans le 


polycopié INF421. Il est inspiré de l’introduction de l’ouvrage [Kleinberg and Tardos, 2005]. 
L'analyse du problème du calcul du maximum, et de ses variations est basée sur [|Froidevaux et al., 1993]. 


Chapitre 11 


Complexité en temps 


Ce chapitre se focalise sur l’étude d’une ressource particulière élémentaire d’un 
algorithme : le temps qu’il prend pour s’exécuter. 


Le chapitre précédent s’applique en particulier à cette mesure : le temps de calcul 
d’un algorithme est défini comme le temps qu’il prend pour s’exécuter. 


Pour appuyer et illustrer l’idée de l’importance de la mesure de cette notion de 
complexité, intéressons nous au temps correspondant à la complexité des algorithmes 
n, n logo n, n?,n$,1.5, 2" et n! pour des entrées de taille n croissantes, sur un pro- 
cesseur capable d’exécuter un million d’instructions élémentaires par seconde. Nous 
notons oo dans le tableau suivant dès que le temps dépasse 102° années (ce tableau est 


repris de |Kleinberg and Tardos, 2005). 


2 3 


Complexité n nlogn n n 1.57 27 

n = 10 <1ls <I1s <1s <1s <1s <1s 4s 

n = 30 <1s <I1s <1s <1s <1s 18 min 1075 ans 
n = 50 <1s <I1s <1s <1s 11 min 36 ans ce 

n = 100 <1s <Is <1s 1s 12,9ans 10!7ans 

n = 1000 <1s <I1s 1s 18 min ce ce ee 

n = 10000 <1s <Is 2 min 12 jours OO 00 00 

n = 100000 <1s 2s 3 heures 32 ans ee ee ee 

n = 1000000  1s 20s 12 jours 31,710ans co CO ee 


On le voit, un algorithme de complexité exponentielle est très rapidement inutili- 
sable, et donc pas frès raisonnable. Tout l’objet du chapitre est de comprendre ce que 
l’on appelle un algorithme raisonnable en informatique, et de comprendre la théorie 
de la NP-complétude qui permet de discuter la frontière entre le raisonnable et le non 
raisonnable. 
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11.1 La notion de temps raisonnable 


11.1.1 Convention 
Pour différentes raisons, la convention suivante s’est imposée en informatique : 


Définition 11.1 (Algorithme efficace) Un algorithme est efficace si sa complexité en 
temps est polynomiale, c'est-à-dire en O(n*) pour un entier k. 


Il ne s’agit que d’une convention, et on aurait pu en choisir d’autres (et à vrai dire 
il y en a eu d’autres avant celle-là, qui s’est imposée dans les années 1970). 


Remarque 11.1 On peut argumenter qu'un algorithme de complexité O(n!7%) n’est 
pas très raisonnable. Certes, mais il faut bien fixer une convention. On considère que 
c'est raisonnable en théorie de la complexité. 


Remarque 11.2 Pourquoi ne pas prendre un temps linéaire, ou un temps quadratique 
comme notion de “raisonnable” : parce que cela ne fonctionne pas bien. En particu- 
lier, ces notions de temps linéaires et quadratiques ne vérifieraient pas la “Deuxième 
raison : s'affranchir du modèle de calcul” évoquée plus bas : la notion de temps li- 
néaire ou de temps quadratique dépend du modèle de calcul utilisé, contrairement à la 
notion de calcul en temps polynomial. 


11.12 Première raison : s’affranchir du codage 


Une des raisons de cette convention est la remarque suivante : la plupart des objets 
informatiques usuels peuvent se représenter de différentes façons, mais passer d’une 
façon de les représenter à l’autre est possible en un temps qui reste polynomial en la 
taille du codage. 

La classe des polynômes étant stable par composition, cela implique qu’un algo- 
rithme qui est polynomial et qui travaille sur une représentation se transforme en un 
algorithme polynomial qui travaille sur toute autre représentation de l’objet. 

On peut donc parler d’algorithme efficace sur ces objets sans avoir à rentrer dans 
les détails de comment on écrit ces objets. 


Exemple 11.1 Un graphe peut se représenter par une matrice, sa matrice d’adja- 
cence : si le graphe possède n sommets, on considère un tableau T de taille n par 
n, dont l'élément Tfil[jÿ] € {0,1} vaut 1 si et seulement s’il y a une arête entre le 
sommet à et le sommet j. 

On peut aussi représenter un graphe par des listes d’adjacence : pour représenter 
un graphe à n sommets, on considère n listes. La liste de numéro i code les voisins du 
sommet numéro 1. 

On peut passer d’une représentation à l’autre en un temps qui est polynomial en la 
taille de chacune : on laisse le lecteur se persuader de la chose dans son langage de 
programmation préféré. 

Un algorithme efficace pour l’une des représentations peut toujours se transformer 
en un algorithme efficace pour l’autre représentation : il suffit de commencer éven- 
tuellement par traduire la représentation en la représentation sur laquelle travaille 
l'algorithme. 
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Remarque 11.3 Par ailleurs, par les mêmes remarques, puisque chacune de ces repré- 
sentations est de taille polynomiale en n, en utilisant le fait qu'un graphe à n sommet a 
au plus n? arêtes, un algorithme polynomial en n n’est rien d'autre qu'un algorithme 
efficace qui travaille sur les graphes, c’est-à-dire sur les représentations précédentes, 
ou toutes les représentations usuelles des graphes. 


11.13 Deuxième raison : s’affranchir du modèle de calcul 


Une deuxième raison profonde est la suivante : revenons sur le chapitre [7] Nous 
avons montré que tous les modèles de calculs de ce chapitre se simulaient l’un et 
l’autre : machines RAM, machines de Turing, machines à piles, machines à compteurs. 

Si l’on met de côté les machines à compteur dont la simulation est particulièrement 
inefficace, et dont l’intérêt n’est que théorique, on peut remarquer qu’un nombre { 
d'instructions pour l’un se simule en utilisant un nombre polynomial en t d’instructions 
pour l’autre. La classe des polynômes étant stable par composition, cela implique qu’un 
algorithme qui est polynomial dans un modèle de calcul se transforme en un algorithme 
polynomial en chacun des autres modèles de calcul (quitte à simuler l’un par l’autre). 

On peut donc parler d’algorithme efficace sur un objet sans avoir à préciser si l’on 
programme l’algorithme dans un modèle de calcul ou dans un autre modèle de calcul|\| 

En particulier, la notion d’algorithme efficace est indépendante du langage de pro- 
grammation utilisé : un algorithme efficace en CAML est un algorithme efficace en 
JAVA, ou un algorithme efficace en C. 

Puisque la notion d’efficacité ne dépend pas du modèle, on va donc utiliser celui de 
la machine de Turing dans tout ce qui suit : lorsque w est un mot, rappelons que l’on 
note par |w| sa longueur. 


Définition 11.2 (TIME(t(n))) Soit t : N — N'une fonction. On définit la classe TIME(t(n)) 
comme la classe des problèmes (langages) décidés par une machine de Turing en temps 
O(t(n)), où n est la taille de l'entrée. 


Si on préfère, L € TIME(t(n)) s’il y a une machine de Turing M telle que 
— M décide L : pour tout mot w, M accepte w si et seulement si w € L, et M 
refuse w si et seulement si w € L: 
— M prend un temps borné par O(t(n)) : 
— si l’on préfère : il y a des entiers no, c, et k tels pour tout mot w, si w est de 
taille suffisamment grande, c’est-à-dire si [w| > no, alors M accepte ou refuse 
en utilisant au plus c x n° étapes, où n — |w| désigne la longueur du mot w. 
Rappelons que l’on s’intéresse dans ce chapitre et dans le suivant (et en complexité) 
uniquement à des problèmes décidables. 


1. Les plus puristes auront remarqué un problème avec le modèle des machines RAM du chapitre[7|: il 
faut prendre en compte dans la complexité la taille des entiers dans les opérations élémentaires effectuées et 
pas seulement le nombre d’instructions. Mais c’est de l’ergotage, et ce qui est écrit au dessus reste totalement 
vrai, si l’on interdit aux machines RAM de manipuler des entiers de taille arbitraire. De toute façon, ne pas 
le faire ne serait pas réaliste par rapport aux processeurs qu’ils entendent modéliser qui travaillent sur des 
entiers codés sur un nombre fini de bits (32 ou 64 par exemple). 
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11.1.4 Classe P 


La classe des problèmes qui admettent un algorithme raisonnable correspond alors 
à la classe suivante. 


Définition 11.3 (Classe P) La classe P est la classe des problèmes (langages) définie 
par : 
P = | J TIME(n*). 
kEN 


Autrement-dit, P est exactement la classe des problèmes qui admettent un algo- 
rithme polynomial. 
Voici quelques exemples de problèmes de P. 


Exemple 11.2 (Tester le coloriage d’un graphe) Donnée: Un graphe G = (V,E) 
avec pour chaque sommet v € V la donnée d’une couleur parmi un nombre fini 
de couleurs. 

Réponse: Décider si G est colorié avec ces couleurs : c’est-à-dire si il n’y a pas 
d’arête de G avec deux extrémités de la même couleur. 
Ce problème est dans la classe P. En effet, il suffit de parcourir les arêtes du graphe 
et de tester pour chacune si la couleur de ses extrémités est la même. 


Exemple 11.3 (Evaluation en calcul propositionnel) Donnée: Une formule F(x1,2%2,--- 


du calcul propositionnel, des valeurs æ1,--: ,xh € {0,1} pour chacune des va- 
riables de la formule. 
Réponse: Décider si la formule F s’évalue en vraie pour ces valeurs des variables. 
Ce problème est dans la classe P. En effet, étant donnée une formule du calcul 
propositionnel F(x1,-::,x,) et des valeurs pour t1,x2,--- ,æn € {0,1}, il est facile 
de calculer la valeur de vérité de F(x1,--- ,x,). Cela se fait en un temps que l’on 
vérifie facilement comme polynomial en la taille de l'entrée. 


Beaucoup d’autres problèmes sont dans P. 


11.2 Comparer les problèmes 


11.2.1 Motivation 


Il s’avère toutefois qu’il y a toute une classe de problèmes pour lesquels à ce jour 
on n’arrive pas à construire d’algorithme polynomial, mais sans qu’on arrive à prouver 
formellement que cela ne soit pas possible. 

C’est historiquement ce qui a mené à considérer la classe de problèmes que l’on 
appelle NP, que nous verrons dans la section suivante. 

Des exemples de problèmes dans cette classe sont les suivants : 


Exemple 11.4 (k-COLORABILITE) Donnée: Un graphe G = (V,E) et un en- 
tier k. 


»Tn) 
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Réponse: Décider s’il existe un coloriage du graphe utilisant au plus k couleurs : 
c'est-à-dire décider s’il existe une façon de colorier les sommets de G avec au 
plus k couleurs pour obtenir un coloriage de G. 


Exemple 11.5 (SAT, Satisfaction en calcul proposititionnel) Donnée: Une for- 


mule F = (x1,-.,7,) du calcul propositionnel. 
Réponse: Décider si Fest satisfiable : c’est-à-dire décider s’il existe &1,::: ,%n € 
{0,1}" rel que F s’évalue en vraie pour cette valeur de ses variables x1,--: ,%n. 


Exemple 11.6 (CIRCUIT HAMILTONIEN) Donnée: Un graphe G = (V,E) (non- 
orienté). 
Réponse: Décider s’il existe un circuit hamiltonien, c’est-à-dire décider s’il existe 
un chemin de G passant une fois et une seule par chacun des sommets et revenant 
à son point de départ. 


Pour les trois problèmes on connaît des algorithmes exponentiels : tester tous les 
coloriages, pour le premier, ou toutes les valeurs de {0,1}"” pour le second, ou tous 
les chemins pour le dernier. Pour les trois problèmes on ne connaît pas d’algorithme 
efficace (polynomial), et on n’arrive pas à prouver qu’il n’y en a pas. 

Comme nous allons le voir, on sait toutefois montrer que ces trois problèmes sont 
équivalents au niveau de leur difficulté, et cela nous amène à la notion de réduction, 
c’est-à-dire à l’idée de comparer la difficulté des problèmes. 

Avant, quelques précisions. 


11.22 Remarques 


Dans ce chapitre et le suivant, on va ne parler essentiellement que de problèmes de 
décisions, c’est-à-dire de problèmes dont la réponse est soit “vraie” ou “fausse” : voir 
la définition[8.2] 


Exemple 11.7 “Trier n nombres” n’est pas un problème de décision : la sortie est a 
priori une liste triée de nombres. 


Exemple 11.8 “Étant donné un graphe G = (V, E), déterminer le nombre de couleurs 
pour colorier G” n’est pas un un problème de décision, car la sortie est un entier. 
On peut toutefois formuler un problème de décision proche, du type “Étant donné un 
graphe G = (V,E), et un entier k, déterminer si le graphe G admet un coloriage avec 
moins de k couleurs” : c’est le problème k-COLORABILITE. 


Avant de pouvoir parler de réduction, il faut aussi parler de fonctions calculables 
en temps polynomial : c’est la notion à laquelle on s’attend, même si on est obligé de 
l'écrire car on ne l’a encore jamais fait. 


Définition 11.4 (Fonction calculable en temps polynomial) Soient Z et ©” deux al- 
phabets. Une fonction f : Z* — Y/* est calculable en temps polynomial s’il existe une 
machine de Turing À, qui travaille sur l’alphabet SU Y, et un entier k, telle que pour 
tout mot w, À avec l'entrée w termine en un temps O(n*) avec lorsqu'elle termine 
f(w) écrit sur son ruban, où n = |wl. 
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VRAI () VRAI 
FAUX () FAUX 
Problème À Problème B 


FIGURE 11.1 — Les réductions transforment des instances positives en instances posi- 
tives, et négatives en négatives. 


Instance du Instance du 
— Î ———> 


à : Algorithme >—- oui 
problème À problème B 


non 


FIGURE 11.2 —- Réduction du problème À vers le problème B. Si l’on peut résoudre 
le problème B en temps polynomial, alors on peut résoudre le problème À en temps 
polynomial. Le problème À est donc plus facile que le problème B, noté À < B. 


Le résultat suivant est facile à établir : 


Proposition 11.1 (Stabilité par composition) La composée de deux fonctions calcu- 
lables en temps polynomial est calculable en temps polynomial. 


11.23 Notion de réduction 


Cela nous permet d’introduire une notion de réduction entre problèmes (similaire à 
celle du chapitre|[8| si ce n’est que l’on parle de calculable en temps polynomial plutôt 
que de calculable) : l’idée est que si À se réduit à B, alors le problème À est plus facile 
que le problème B, ou si l’on préfère, le problème B est plus difficile que le problème 


A : voir la figure et la figure 


Définition 11.5 (Réduction) Soient À et B deux problèmes d’'alphabet respectifs MA 
et MB. Une réduction de À vers B est une fonction f : M — M5 calculable en 
temps polynomial telle que w € À ssi f(w) € B. On note À < B lorsque À se réduit 
à B. 
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Cela se comporte comme on le souhaite : un problème est aussi facile (et difficile) 
que lui-même, et la relation “être plus facile que” est transitive. En d’autres termes : 


Théorème 11.1 < est un préordre : 
1 L<E; 
2. Li < Lo, Lo < L3 impliquent Li < L3. 


Démonstration: Considérer la fonction identité comme fonction f pour le premier 
point. 

Pour le second point, supposons L1 < L2 via la réduction f, et Li < L3 via la 
réduction g. On a x € L; ssi g(f(x)) € Lo. I suffit alors de voir que go f, en temps 
que composée de deux fonctions calculables en temps polynomial est calculable en 
temps polynomial. 


Remarque 11.4 J! ne s’agit pas d’un ordre, puisque Li < La, La < Li n'implique 
pas Li = Lo. 


Il est alors naturel d’introduire : 


Définition 11.6 Deux problèmes L; et L2 sont équivalents, noté Li = L:, si Li < Lo 
et si L < L1. 


On a alors Li < Lo, La < LA impliquent Li = L2. 


11.24 Application à la comparaison de difficulté 


Intuitivement, si un problème est plus facile qu’un problème polynomial, alors il 
est polynomial. Formellement : 


Proposition 11.2 (Réduction) Si À < B, et si B € P alors A € P. 


Démonstration: Soit f une réduction de À vers B. À est décidé par la machine de 
Turing qui, sur une entrée w, calcule f (w), puis simule la machine de Turing qui décide 
B sur l'entrée f(w). Puisqu’on a w € À si et seulement si f(w) € B, l'algorithme est 
correct, et fonctionne bien en temps polynomial. 

En prenant la contraposée de la proposition précédente, on obtient la formulation 
suivante qui dit que si un problème n’a pas d’algorithme polynomial, et qu’il est plus 
facile qu’un autre, alors l’autre non plus. 


Proposition 11.3 (Réduction) Si À < B, et si À € P alors B € P. 


Exemple 11.9 Nous verrons que le problème d’un coloriage d’un graphe, de la satis- 
faction du calcul propositionnel, ou de l'existence d’un chemin hamiltonien sont équi- 
valents (et équivalents à tous les problèmes NP-complets). Il y a donc un algorithme 
efficace pour l’un ssi il y en a un pour l’autre. 
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11.2.5 Problèmes les plus durs 


Si on considère une classe de problèmes, on peut introduire la notion de problème 
le plus difficile pour la classe, i.e. maximum pour <. C’est la notion de complétude : 


Définition 11.7 (C-complétude) Soit C une classe de problèmes de décisions. 
Un problème À est dit C-complet, si 
1. ilest dans C ; 
2. tout autre problème B de C est tel que B < À. 


On dit qu’un problème À est C-dur s’il vérifie la condition 2 de la définition[11.7] 
Un problème À est donc C-complet s’il est C-dur et dans la classe C. 

Un problème C-complet est donc le plus difficile, ou un des plus difficiles, de la 
classe C. Clairement, s’il y en a plusieurs, ils sont équivalents : 


Corollaire 11.1 Soit C une classe de langages. Tous les problèmes C-complets sont 
équivalents. 


Démonstration: Soient À et B deux problèmes C-complets. Appliquer la condition 2 
de la définition|11.7|en À relativement à B € C,eten B relativement à À € C. 


11.3 La classe NP 


11.3.1 La notion de vérificateur 


Les problèmes k-COLORABILITE, SAT et CIRCUIT HAMILTONIEN évoqués 
précédemment ont un point commun : s’il n’est pas clair qu’ils admettent un algorithme 
polynomial, il est clair qu’ils admettent un vérificateur polynomial. 


Définition 11.8 (Vérificateur) Un vérificateur pour un problème À est un algorithme 
V tel que 
A = {w|V accepte (w,u) pour un certain mot u}. 


Le vérificateur est polynomial si V se décide en temps polynomial en la longueur 
de w. On dit qu’un langage est polynomialement vérifiable s’il admet un vérificateur 
polynomial. 


Le mot u est alors appelé un certificat (parfois aussi une preuve) pour w. Autrement 
dit, un vérificateur utilise une information en plus, à savoir u pour vérifier que w est 
dans À. 


Remarque 11.5 Remarquons que l’on peut toujours se restreindre aux certificats de 
longueur polynomiale en la longueur de w, puisqu'’en temps polynomial en la longueur 
de w l’algorithme V ne pourra pas lire plus qu'un nombre polynomial de symboles du 
certificat. 


Exemple 11.10 Un certificat pour le problème k-COLORABILITE est la donnée des 
couleurs pour chaque sommet. 
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Nous ne donnerons pas toujours autant de détails, mais voici la justification : en 
effet, un graphe G est dans &-COLORABILITE si et seulement si on peut trouver un 
mot w qui code des couleurs pour chaque sommet tel que ces couleurs donnent un 
coloriage correct : l’algorithme V, i.e. le vérificateur, se contente, étant donné (G', u) 
de vérifier que le coloriage est correct, ce qui se fait bien en temps polynomial en la 
taille du graphe : voir la discussion de l’exemple[112] 


Exemple 11.11 Un certificat pour le problème SAT est la donnée d’une valeur x1,::: ,%n € 
{0,1} pour chacune des variables de la formule F : le vérificateur, qui se contente de 
vérifier que ces valeurs satisfont la formule F, peut bien se réaliser en temps polyno- 


mial en la taille de la formule : voir l'exemple 


Exemple 11.12 Un certificat pour le problème CIRCUIT HAMILTONIEN est la don- 
née d’un circuit. Le vérificateur se contente de vérifier que le circuit est hamiltonien, 
ce qui se fait bien en temps polynomial. 


Cela nous amène à la définition suivante : 


Définition 11.9 NP est la classe des problèmes (langages) qui possèdent un vérifica- 
teur polynomial. 


Cette classe est importante car elle s’avère contenir un nombre incroyable de pro- 
blèmes d'intérêt pratique. Elle contient &-COLORABILITE, SAT et CIRCUIT HA- 
MILTONIEN mais aussi beaucoup d’autres problèmes : voir par exemple tout le cha- 
pitre qui suit. 

Par construction, on a (car le mot vide est par exemple un certificat pour tout pro- 
blème de P) : 


Proposition 11.4 P C NP. 


11.3.2 La question P = NP ? 


Clairement, on a soit P = NP soit P € NP : voir la figure[T1.3] 

La question de savoir si ces deux classes sont égales ou distinctes est d’un enjeu 
impressionnant. D’une part parce que c’est l’une des questions (voire la question) non 
résolue les plus célèbres de l’informatique théorique et des mathématiques qui défie les 
chercheurs depuis plus de 40 ans : elle a été placée parmi la liste des questions les plus 
importantes pour les mathématiques et l’informatique pour le millénaire en 2000. Le 
Clay Mathematics Institute offre 1 000 000 de dollars à qui déterminerait la réponse à 
cette question. 

Surtout, si P = NP, alors tous les problèmes vérifiables polynomialement seraient 
décidables en temps polynomial. La plupart des personnes pensent que ces deux classes 
sont distinctes car il y a un très grand nombre de problèmes pour lesquels on n’arrive 
pas à produire d’algorithme polynomiaux depuis plus de 40 ans. 

Elle à aussi un enjeu économique impressionnant puisque de nombreux systèmes, 
dont certains systèmes de cryptographie actuels sont basés sur l’hypothèse que ces 
deux classes sont distinctes : si ce n’était pas le cas, de nombreuses considérations sur 
ces systèmes s’effondreraient, et de nombreuses techniques de cryptage devraient être 
revues. 
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NP 


FIGURE 11.3 — Une des deux possibilités est correcte. 


11.33 Temps non déterministe polynomial 


Faisons tout d’abord une petite parenthèse sur la terminologie : le “N” dans NP 
vient de non déterministe (et pas de non, ou not comme souvent beaucoup le croient), 
en raison du résultat suivant : 


Théorème 11.2 Un problème est dans NP si et seulement s’il est décidé par une ma- 
chine de Turing non déterministe en temps polynomial. 


Rappelons que nous avons introduit les machines de Turing non déterministes dans 
le chapitre[7] On dit qu’un langage L € X* est décidé par la machine non déterministe 
M en temps polynomial si M décide L et M prend un temps borné par O(t(n)) : il 
y a des entiers no, c, et k tels que pour tout mot w de taille suffisamment grande, i.e. 
lw) > no, et pour tout mot w, si on note n = |w] sa longueur, pour w € L, M admet 
un calcul qui accepte en utilisant moins de cxn* étapes, et pour w  L, tous les calculs 
de M mènent à une configuration de refus en moins de c x n} étapes. 

Démonstration: Considérons un problème À de NP. Soit V le vérificateur associé, 
qui fonctionne en temps polynomial p(n). On construit une machine de Turing M non 
déterministe qui, sur un mot w, va produire de façon non déterministe un mot « de 
longueur p(n) puis simuler V sur (w,u) : si V accepte, alors M accepte. Si V refuse, 
alors M refuse. La machine M décide À. 

Réciproquement, soit À un problème décidé par une machine de Turing non dé- 
terministe M1 en temps polynomial p(n). Comme dans la preuve de la proposition [7.3] 
dans le chapitre [8] on peut affirmer que le degré de non déterminisme de la machine 
est borné, et qu’il vaut un certain entier r, et que les suites des choix non déterministes 
réalisées par la machine 7 jusqu’au temps t se codent par une suite de longueur t 
d’entiers entre 1 à (au plus) r. 

Par conséquent, une suite d’entiers de longueur p(n) entre 1 et r est un certificat 
valide pour un mot w : étant donné w et un mot u codant une telle suite, un vérificateur 
V peut facilement vérifier en temps polynomial si la machine M accepte w avec ces 
choix non déterministes. 

Plus généralement, on définit : 
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Définition 11.10 (NTIME(t(n))) Soit t : N — N une fonction. On définit la classe 
NTIME(t(n)) comme la classe des problèmes (langages) décidés par une machine de 
Turing non déterministe en temps O(t(n)), où n est la taille de l'entrée. 


Corollaire 11.2 


NP = | J NTIME(n*). 
kEeN 


11.3.4 NP-complétude 


Il s’avère que la classe NP possède une multitude de problèmes complets : le pro- 
chain chapitre en présente toute une liste. 


La difficulté est d’arriver à en produire un premier. C’est l’objet du théorème de 
Cook et Levin. 


Théorème 11.3 (Cook-Levin) Le problème SAT est NP-complet. 


Nous prouverons ce théorème dans la section qui suit. 
Commençons par reformuler ce que cela signifie. 


Corollaire 11.3 P = NP si et seulement si SATE P. 


Démonstration: Puisque SAT est dans NP, si P — NP, alors SATE P. 

Réciproquement, puisque SAT est complet, pour tout problème B € NP, B < 
SAT et donc B € P si SAT € P par la proposition|[11.2] 

Ce que nous venons de faire est vrai pour n’importe quel problème NP-complet. 


Théorème 11.4 Soit À un problème NP-complet. 
P = NP siet seulement si À € P. 


Démonstration: Puisque À est complet il est dans NP, et donc si P = NP, alors 
A € P. Réciproquement, puisque À est NP-dur, pour tout problème B € NP, B < A 
et donc B € Psi À € P par la proposition 


Remarque 11.6 On voit donc tout l’enjeu de produire des problèmes NP-complets 
pour la question de prouver P Æ NP : tenter de produire un problème pour lequel on 
arriverait à prouver qu'il n'existe pas d’algorithme polynomial. À ce jour, aucun des 
centaines, voir des milliers de problèmes NP-complets connus n'ont permis cependant 
de prouver que P Æ NP. 


Remarque 11.7 Rappelons nous que tous les problèmes complets sont équivalents en 


difficulté par le corollaire 
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Problèmes NP-complets 


Problèmes NP 


Problèmes P 


FIGURE 11.4 — Situation avec l’hypothèse P Z NP. 


11.35 Méthode pour prouver la NP-complétude 


La NP-complétude d’un problème s’obtient dans la quasi-totalité des cas de la 
façon suivante : 
Pour prouver la NP-complétude d’un problème À, il suffit : 


1. de prouver qu'il est dans NP ; 


2. et de prouver que B < À pour un problème B que l’on sait déjà NP- 
complet. 


En effet, le point 1. permet de garantir que B € NP, et le point 2. de garantir que 
pour tout problème C € NP on a C < À : en effet, par la NP-complétude de B on a 
C < B, et puisque B < À, on obtient C < A. 


Remarque 11.8 Attention, la NP-complétude d’un problème A s'obtient en prouvant 
qu'il est plus difficile qu’un autre problème NP-complet, et pas le contraire. C’est une 
erreur fréquente dans les raisonnements. 


Le chapitre suivant est consacré à de multiples applications de cette stratégie pour 
différents problèmes. 


11.3.6 Preuve du théorème de Cook-Levin 


Nous ne pouvons pas appliquer la méthode précédente pour prouver la NP-complétude 
de SAT, car nous ne connaissons encore aucun problème NP-complet. 

Il nous faut donc faire une preuve autrement, en revenant à la définition de la NP- 
complétude : il faut prouver d’une part que SAT est dans NP, et d’autre part que tout 
problème À de NP vérifie À < SAT. 

Le fait que SAT est dans NP a déjà été établi : voir l’exemple[IT.11] 

Considérons un problème À de NP, et un vérificateur V associé. L’idée (qui a 
certaines similarités avec les constructions du chapitre [5) est, étant donné un mot w, 
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de construire une formule propositionnelle + — (uw) qui code l’existence d’un calcul 
accepteur de V sur (w,u) pour un certificat u. 

On va en fait construire une série de formules dont le point culminant sera la for- 
mule 7 = (u) qui codera l’existence d’une suite de configurations Co, C1,--: , C4 de 
M telle que : 

— Cÿ est la configuration initiale de V sur (w, u) ; 

— C;:1 est la configuration successeur de C;, selon la fonction de transition 6 de la 

machine de Turing V, pour à <t; 

— C; est une configuration acceptante. 

En d’autres termes, l’existence d’un diagramme espace-temps valide correspondant à 
un calcul de V sur (w, u). 

En observant que la formule propositionnelle obtenue y reste de taille polynomiale 
en la taille de w, et peut bien s’obtenir par un algorithme polynomial à partir de w, 
on aura prouvé le théorème : en effet, on aura w € L si et seulement s’il existe w qui 
satisfait y(u), c’est-à-dire À < SAT via la fonction f qui à w associe y(u). 

Il ne reste plus qu’à donner les détails fastidieux de la construction de la formule 
y(u). Par hypothèse, V fonctionne en temps polynomial p(n) en la taille n de w. En 
ce temps là, V ne peut pas déplacer sa tête de lecture de plus de p(n) cases vers la 
droite, ou de p(n) cases vers la gauche. On peut donc se restreindre à considérer un 
sous-rectangle de taille (2 xp(n) + 1) x p(n) du diagramme espace-temps du calcul de 
V sur (w, u) : voir la figure[11.5] 

Les cases du tableau Ti, j] correspondant au diagramme espace temps sont des 
éléments de l’ensemble fini © = T U Q. Pour chaque 1 < à < p(n)et 1 < j < 
2 x p(n) + 1 et pour chaque s € C, on définit une variable propositionnelle x; ;,.. Si 
Ti,j,s Vaut 1, cela signifie que la case T{i, 5] du tableau contient s. 

La formule l'est la conjonction de 4 formules CELL ASTARTAMOVEAHALT. 

La formule CELL permet de garantir qu’il y a bien un symbole et un seul par case. 


CELL = À [V se) A JM Cie V m4) 


1<i<p(n),1<j<2p(n)+1 sec s,t€C,s£t 


Les symboles /\ et \/ désignent l’itération des symboles À et V correspondants. 
Par exemple, Viec z;,j,s €St un raccourci pour la formule z;;:, V +: V Xi, Si 
C= fs. a}. 

Si on note le mot e1e2 - --e,, le mot (w, u), la formule START permet de garantir 
que la première ligne correspond bien à la configuration initiale du calcul de V sur 
(w,u). 


START — T1,1,B V T1,2,B VsreV T1,p(n)+1,q0 V T1 ,p(n)+2,e1 Vers T1,p(n)+m+1,em 


VTi,p(n)+m+2,B V °°" V Ti,2p(n)+1,B- 


La formule HALT permet de garantir qu’une des lignes correspond bien à une 
configuration acceptante 
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B|B|B|B|B|H&|ea|e2l..[Em B\B|B BB B|B|B| B|B Configuration initiale 
Deuxième configuration 
Troisième configuration 
fenêtre 
LT 
LT 
LT 
LL 

p(n)ème configuration 

2 x p(n) +1 > 


FIGURE 11.5 — Un tableau (2p(n) + 1) x p(n) codant le diagramme espace-temps du 
calcul de V sur (w, u). 
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HALT = \F Hp as 
1£i<p(n),1£5<2p(n)+1 


Enfin la formule MOVE écrit que tous les sous-rectangles 3 x 2 du tableau T' sont 
des fenêtres légales : voir la notion de fenêtre légale du chapitre|7] 


MOVE = À LEGAL 
1<i<p(n),1<j<2p(n)+1 


4599 


où LEGAL; ; est une formule propositionnelle qui exprime que le sous-rectangle 
3 x 2 à la position ?, j est une fenêtre légale : 


LEGAL;,; = A (Ti,5-1,a Ti, Ti 541, \Ti1,5—1,4\Ti+1,5,e\Ti,541,f)à 
(a,b,c,d,e,f)E WINDOW 


où WINDOW est l’ensemble des 6-uplets (a, b, c, d,e, f) tels que si trois éléments 
de Y représentés respectivement par a, b et c apparaissent consécutivement dans une 
configuration C;, et si d,e, f apparaissent consécutivement aux mêmes emplacements 
dans la configuration C; 1, alors cela est cohérent avec la fonction de transition 6 de la 
machine de Turing M. 

Ceci termine la preuve, si l’on ajoute que chacune de ces formules sont faciles à 
écrire (et donc produisibles facilement en temps polynomial à partir de w), et qu’elles 
restent bien de taille polynomiale en la taille de w. 


11.4 Quelques autres résultats de la théorie de la com- 
plexité 


Commençons par une remarque à propos de l’hypothèse que nous avons faite sur 
le fait de restreindre notre discussion aux problèmes de décision. 


11.4.1 Décision vs Construction 


Nous avons parlé jusque-là uniquement de problèmes de décision, c’est-à-dire dont 
la réponse est soit vraie ou soit fausse (par exemple : “étant donnée une formule F, 
décider si la formule Fest satisfiable”) en opposition aux problèmes qui consisteraient 
à produire un objet avec une propriété (par exemple : étant donnée une formule F, 
produire une affectation des variables qui la satisfait s’il en existe une). 

Clairement, produire une solution est plus difficile que de savoir s’il en existe une, 
et donc si P -£ NP, aucun de ces deux problèmes n’admet une solution en temps 
polynomial, et ce pour tout problème NP-complet. 

Cependant, si P — NP, il s’avère qu’alors on sait aussi produire une solution : 


Théorème 11.5 Supposons que P = NP. Soit L un problème de NP et V un vérifi- 
cateur associé. On peut construire une machine de Turing qui sur toute entrée w € L 
produit en temps polynomial un certificat u pour w pour le vérificateur V. 
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Démonstration: Commençons par le prouver pour L correspondant au problème 
de la satisfaction de formules (problème SAT). Supposons P — NP : on peut donc 
tester si une formule propositionnelle F à n variables est satisfiable ou non en temps 
polynomial. Si elle est satisfiable, alors on peut fixer sa première variable à 0, et tester 
si la formule obtenue F5 est satisfiable. Si elle l’est, alors on écrit 0 et on recommence 
récursivement avec cette formule Fy à n — 1 variables. Sinon, nécessairement tout 
certificat doit avoir sa première variable à 1, on écrit 1, et on recommence récursivement 
avec la formule F; dont la première variable est fixée à 1, qui possède n — 1 variables. 
Puisqu’il est facile de vérifier si une formule sans variable est satisfiable, par cette 
méthode, on aura écrit un certificat. 

Maintenant si L est un langage quelconque de NP, on peut utiliser le fait que la ré- 
duction produite par la preuve du théorème de Cook-Levin est en fait une réduction de 
Levin : non seulement on a w € L si et seulement si f(w) est une formule satisfiable, 
mais on peut aussi retrouver un certificat pour w à partir d’un certificat de la satisfiabi- 
lité de la formule f(w). On peut donc utiliser l’algorithme précédent pour retrouver un 
certificat pour L. 

En fait, on vient d’utiliser le fait que le problème de la satisfiabilité d’une formule 
est auto-réductible à des instances de tailles inférieures. 


11.4.2 Théorèmes de hiérarchie 


On dit qu’une fonction f(n) > nlog(n) est constructible en temps, si la fonction 
qui envoie 1” sur la représentation binaire de 1/(7) est calculable en temps O(f(n)). 

La plupart des fonctions usuelles sont constructibles en temps, et en pratique ce 
n’est pas vraiment une restriction. 


Remarque 11.9 Par exemple, n\/n est constructible en temps : sur l'entrée 1", on 
commence par compter le nombre de 1 en binaire : on peut utiliser pour cela un 
compteur, qui reste de taille log(n), que l’on incrémente : cela se fait donc en temps 
O(nlog(n)) puisqu'on utilise au plus O(log(n)) étapes pour chaque lettre du mot en 
entrée. On peut alors calculer |n\/n] en binaire à partir de la représentation de n. 
N'importe quelle méthode pour faire cela fonctionne en temps O(nlog(n)), puisque la 
taille des nombres impliqués est O(log(n)). 


Théorème 11.6 (Théorème de hiérarchie) Pour toute fonction f : N — N construc- 
tible en temps, il existe un langage L qui est décidable en temps O(f(n)) mais pas en 


temps o(f(n)). 


Démonstration: Il s’agit d’une généralisation de l’idée de la preuve du théorème 
du chapitre suivant : nous invitons notre lecteur à commencer par cette dernière 
preuve. 

Nous prouverons une version plus faible que l’énoncé plus haut. Soit f : NN 
une fonction constructible en temps. 

On considère le langage (très artificiel) L qui est décidé par la machine de Turing 
B suivante : 

— sur une entrée w de taille n, B calcule f(n) et mémorise (f(n)) le codage en 

binaire de f(n) dans un compteur binaire c; 
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— Si w n’est pas de la forme (A)10*, pour un certaine machine de Turing À, alors 

la machine de Turing B refuse. 

— Sinon, B simule À sur le mot w pendant f(n) étapes pour déterminer si À ac- 

cepte en un temps inférieur à f(n) : 
— si À accepte en ce temps, alors B refuse ; 
— sinon B accepte. 

Autrement dit B simule À sur w, étape par étape, et décrémente le compteur c à 
chaque étape. Si ce compteur c atteint O0 ou si À refuse, alors B accepte. Sinon, B 
refuse. 

Par l’existence d’une machine de Turing universelle, il existe des entiers k et d tels 
que L soit décidé en temps d x f(n}F. 

Supposons que L soit décidé par une machine de Turing À en temps g(n) avec 
g(n}* = o(f(n)). Il doit exister un entier no tel que pour n > no, on ait d x g(n)* < 
f(n). 

Par conséquent, la simulation par B de À sera bien complète sur une entrée de 
longueur no ou plus. 

Considérons ce qui se passe lorsque B est lancé sur l’entrée (A)10"°. Puisque cette 
entrée est de taille plus grande que no, B répond l’inverse de la machine de Turing A 
sur la même entrée. Donc B et À ne décident pas le même langage, et donc la machine 
de Turing À ne décide pas L, ce qui mène à une contradiction. 

Par conséquent L n’est pas décidable en temps g(n) pour toute fonction g(n) avec 
g(n)* = o(f(n)). 

Le théorème est une généralisation de cette idée. Le facteur log vient de la construc- 
tion d’une machine de Turing universelle nettement plus efficace que ceux considérés 
dans ce document, introduisant seulement un ralentissement logarithmique en temps. 


Autrement dit : 


Théorème 11.7 (Théorème de hiérarchie) Soient f, f" : N — N des fonctions construc- 
tibles en temps telles que f(n) log(f(n)) = o(f'(n)). Alors l'inclusion TIME(f) € 
TIME(f') est stricte. 


On obtient par exemple : 
Corollaire 11.4 TIME(n?) € TIME(n&) C TIME(2*). 
On définit : 


Définition 11.11 Soir 
EXPTIME = U TIME(2" ). 
cEeN 


On obtient : 


Corollaire 11.5 P € EXPTIME. 


Démonstration: Tout polynôme devient ultimement négligeable devant 2”, et donc 
P est un sous-ensemble de TIME(2"). Maintenant TIME(2"), qui contient tout P est 
un sous-ensemble strict de, par exemple, TIME(2*), qui est inclus dans EXPTIME. 
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11.43 EXPTIME and NEXPTIME 


Considérons 
EXPTIME = | J TIME(2") 
e>1l 
et 
NEXPTIME = | J NTIME(2"'). 


ce>1l 
On sait prouver le résultat suivant (et ce n’est pas vraiment difficile) : 


Théorème 11.8 Si EXPTIME # NEXPTIME alors P £ NP. 


11.5 Que signifie la question P = NP? 


Nous faisons une digression autour de la signification de cette question en lien avec 
la théorie de la preuve, et les autres chapitres du document. 

On peut voir NP comme classe des langages tel qu’en tester l’appartenance revient 
à déterminer s’il existe un certificat court (polynomial). On peut relier cela à l’exis- 
tence d’une preuve en mathématiques. En effet, dans son principe même, la déduction 
mathématique consiste à produire des théorèmes à partir d’axiomes. 

On s’attend à ce que la validité d’une preuve soit facile à vérifier : il suffit de vérifier 
que chaque ligne de la preuve soit bien la conséquence des lignes précédentes, dans le 
système de preuve. En fait, dans la plupart des systèmes de preuves axiomatiques (par 
exemple dans tous les systèmes de preuve que nous avons vu) cette vérification se fait 
en un temps qui est polynomial en la longueur de la preuve. 

Autrement dit, le problème de décision suivant est NP pour chacun des systèmes 
de preuve axiomatiques usuels À, et en particulier pour celui À que nous avons vu pour 
le calcul des prédicats. 


THEOREMS = {{9,1")|9 possède une preuve de longueur < n 
dans le système 4}. 
Nous laisserons à notre lecteur l’exercice suivant : 


Exercice 11.1. La théorie des ensembles de Zermelo-Fraenkel est un des systèmes 
axiomatiques permettant d’axiomatiser les mathématiques avec une description fi- 
nie. (Même sans connaître tous les détails de la théorie des ensembles de Zermelo- 
Fraenkel) argumenter à un haut niveau que le problème THEOREMS est NP-complet 
pour la théorie des ensembles de Zermelo-Fraenkel. 

Indice : la satisfiabilité d’un circuit booléen est un énoncé. 


Autrement dit, en vertu du théorème la question P — NP est celle (qui a 
été posée par Kurt Güdel) de savoir s’il existe une machine de Turing qui soit capable 
de produire la preuve mathématique de tout énoncé en un temps polynomial en la 
longueur de la preuve. 

Cela semble-t’il raisonnable ? 
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Que signifie la question NP = coNP? Rappelons que coNP est la classe des lan- 
gages dont le complémentaire est dans NP. La question NP — coNP, est reliée à 
l'existence de preuve courte (de certificats) pour des énoncés qui ne semblent pas en 
avoir : par exemple, il est facile de prouver qu’une formule propositionnelle est satis- 
fiable (on produit une valuation de ses entrées, que l’on peut coder dans une preuve qui 
dit qu’en propageant les entrées vers les sorties, le circuit répond 1). Par contre, dans 
le cas général, il n’est pas facile d’écrire une preuve courte qu’une formule proposi- 
tionnelle donnée est non satisfiable. Si NP = coNP, il doit toujours en exister une : la 
question est donc reliée à l’existence d’un autre moyen de prouver la non satisfiabilité 
d’une formule propositionnelle, que les méthodes usuelles. 

On peut reformuler l’équivalent pour chacun des problèmes NP-complets évoqués. 


11.6 Exercices 


Exercice 11.2.  Prouver que la classe P est close par union, concaténation et com- 
plément. 


Exercice 11.3. Prouver que la classe NP est close par union et concaténation. 
Exercice 11.4. Prouver que si NP n'est pas égal à son complément, alors P Z NP. 


Exercice 11.5.  Prouver que si P = NP alors tout langage À € P sauf À = Üet 
A = X* sont NP-complets. 


Exercice 11.6. La sécurité des cryptosystèmes est basée sur l'existence de fonctions 
à sens unique. Dans le cadre de cet exercice, on définit une fonction à sens unique 
comme une fonction f : M* — M* calculable en temps polynomial (déterministe) qui 
préserve les longueurs et qui n’est pas inversible en temps polynomial. Ici M* désigne 
les mots sur l'alphabet fini M. Une fonction préserve les longueurs si la longueur 
de f(x), notée |f(x)|, est la même que celle de x, notée |x|, pour tout x € M. 
Ici inversible signifie : étant donné y, produire soit un x tel que f(x) — y, ou dire 
qu'aucun tel x existe. 


L'objectif de cet exercice est de montrer qu'il existe des fonctions à sens unique si 
et seulement si P £ NP. 

On souhaite prouver d’abord que si P = NP alors il n'existe pas de fonction à sens 
unique. 

Supposons l'alphabet M = {0,1} soit binaire. Soit f une fonction f : M* — M* 
calculable en temps polynomial (déterministe) qui préserve les longueurs et qui est 
inversible. 


1. Expliquer pourquoi le raisonnement suivant est incorrect ou incomplet : “dans 
NP, on peut deviner x et vérifier que f(x) = y. Puisque P = NP, on peut le 
faire de façon déterministe”. 
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2. On note < pour la relation préfixe sur les mots sur M : autrement dit, u < x si 
et seulement s’il existe v tel que x = uv. 


Montrer que le langage 


B = {{y,u)Ax al =lyl, f(x) = y, u< x} 


est dans NP. 

3. En déduire que si P = NP alors il n'existe pas de fonction à sens unique. 

4. Soit ® un circuit booléen avec, disons, m variables. Soit t une chaîne de longueur 
m qui dénote une affectation de ses variables qui rend ® vraie. On considère la 
fonction 

Hill si (t) est vrai 

Ho! si O(t) est faux, 


où # désigne une lettre particulière, et o(t) désigne la valeur du circuit o avec 
l'entrée t. 


640 = | 


Montrer que f préserve les longueurs et est calculable en temps polynomial. 


5. Montrer que le circuit booléen @ est satisfiable si et seulement s’il existe x tel 
que f(x) = gl. 
6. Montrer que f est inversible en temps polynomial si et seulement si P = NP. 


7. Conclure qu'il existe des fonctions à sens unique si et seulement si P Z NP. 


11.7 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de [Sipser, 19971, [Papadimitriou, 1994] et de [Lassaigne and de Rougemont, 20041. 
Arora and Barak, 2009]. 


Un ouvrage de référence et contenant les derniers résultats du domaine est | 


Bibliographie Ce chapitre contient des résultats standards en complexité. Nous nous 
sommes essentiellement inspirés de leur présentation dans les ouvrages [Sipser, 19971, 


|Poizat, 1995], [Papadimitriou, 1994]. La dernière partie discussion est reprise ici de 
sa formulation dans [Arora and Barak, 2009]. 


Chapitre 12 


Quelques problèmes 
NP-complets 


Maintenant que nous connaissons la NP-complétude d’au moins un problème (SAT), 
nous allons montrer qu’un très grand nombre de problèmes sont NP-complets. 

Le livre en recensait plus de 300 en 1979. Nous n’avons 
pas l’ambition d’en présenter autant, mais de décrire quelques problèmes NP-complets 
célèbres, de façon à montrer quelques preuves de NP-complétude. 


12.1 Quelques problèmes NP-complets 


12.1.1 Autour de SAT 


Définition 12.1 (3-SAT) 
Donnée: Un ensemble de variables {x1,:-- ,x,} et une formule F = C1AC2---A 
Ce avec Ci = Yyi1 V Yi,2 V Yi,3, où pour tout i, 5, Yi,j est Soit Tx, SOit Ty pour 
l’un des xx. 
Réponse: Décider si F est satisfiable : c’est-à-dire décider s’il existe x1,--- ,æn € 
{0,1}" tel que F s’évalue en vraie pour cette valeur de ses variables x1,--: ,xn. 


Théorème 12.1 Le problème 3-SAT est NP-complet. 


Démonstration: Notons tout d’abord que 3 — SAT est bien dans NP. En effet, la don- 
née d’une affectation de valeurs de vérité aux variables constitue un certificat vérifiable 
en temps polynomial. 

On va réduire SAT à 3 — SAT. Soit F une formule SAT. Soit C une clause de F, 
par exemple C = xVyVzVuVuVwVt.On introduit de nouvelles variables a, b, c, d 
associées à cette clause, et on remplace C' par la formule 


(@VyVa)A(-aVzVb)A(-bVuVc)A(-cVuV d)A(-dVwVt). 


Il est facile de vérifier qu’une assignation de x, y, z peut être complétée par une as- 
signation de a, b, c, d de façon à rendre cette formule vraie si et seulement si C'est vraie. 
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En appliquant cette construction à toutes les clauses de F et en prenant la conjonction 
des formules ainsi produites, on obtient ainsi une formule 3 — SAT dont la satisfaction 
de F” équivalente à celle de F. 

Le temps de calcul se réduit à écrire les clauses, dont la longueur est polynomiale. 
Par conséquent, l’ensemble du processus de réduction se réalise donc bien en temps 
polynomial, et on a prouvé, à partir de SAT que 3 — SAT est NP-complet. 


Remarque 12.1 Le problème 2 — SAT, où l’on considèrerait des clauses avec deux 
littéraux est lui dans P. 


Définition 12.2 (NAESAT) 
Donnée: Un ensemble de variables {x1,--- ,%,} et un ensemble de clauses y; 1 V 
ce Vyi,k,, OÙ pour tout i, j, Y:,j est soit tr, soit xx pour l’un des x}. 
Réponse: Décider s’il existe une affectation des variables x; € {0,1} de telle sorte 
que chaque clause contienne au moins un littéral vrai et au moins un littéral faux 
(c’est-à-dire, pour tout i, il y a un j et un k avec y; ; = 1'etyir = 0). 


Théorème 12.2 Le problème NAESAT est NP-complet. 


Démonstration: Le problème est dans NP car la donnée d’une affectation des va- 
riables est un certificat valide vérifiable aisément en temps polynomial. 

On va réduire SAT à NAESAT. Soit F° une formule de SAT sur les variables 
{21,-:- ,2,}. On ajoute une unique variable distincte z et on forme les clauses pour 
NAESAT en remplaçant chaque clause C; = yi1 V--- Vy;x de F en C = yi1 V 
ee Vyi V2. 

Cette transformation se réalise bien en temps polynomial. 

Si l’instance donnée de SAT est satisfiable, la même affectation des variables tout 
en fixant pour z la valeur 0 fournit une affectation valide pour NAESAT. 

Réciproquement, supposons que l’instance construite de NAESAT soit satisfai- 
sable. Si la valeur de vérité de z dans l’affectation correspondante est 0, alors les va- 
leurs des variables x; dans l’affectation donnent une affectation valide pour la formule 
F d’origine (pour l'instance de S AT"). Si au contraire z vaut 1, on change toutes les va- 
leurs de toutes les variables dans l’affectation. L’affectation reste valide pour NAESAT 
car au moins un littéral par clause dans l’affectation initiale valait 0, et vaut donc main- 
tenant 1, tandis que z vaut 0. On a donc construit une affectation dans laquelle z vaut 
0, et en vertu du cas précédent l’instance de SAT initiale est satisfaisable. 

On a donc bien prouvé l’équivalence entre satisfaisabilité de F et l’instance corres- 
pondante pour NAESAT. Donc NAESAT est NP-complet. 

En utilisant la même réduction sur 3SAT, on prouve que NAFASAT est NP- 
complet. On va utiliser cette remarque pour prouver : 


Corollaire 12.1 NAE3SATest NP-complet. 


Démonstration: On va réduire NAFASAT à NAE3SAT. Soit C=xVyVzVt 
une clause à 4 littéraux. On introduit une nouvelle variable uc, et on forme les deux 
clauses Ci = x V y V -uc et C2 = z2VtV uc. En faisant ainsi pour toutes les clauses, 
on construit une instance F” de NAE3SAT en temps polynomial. 


12.1. QUELQUES PROBLÈMES NP-COMPLETS 185 


Supposons que F” soit une instance positive de NAE3SAT, et considérons l’affec- 
tation des valeurs de vérité correspondante. Si uc = 0, alors x ou y est 0, et z ou t est 
1, donc x V y V z V { a au moins un littéral 1 et au moins un littéral 0 ; de même, si 
uc = 1; donc Fest une instance positive de de NAFASAT. 

Inversement, si Fest une instance positive de NAEASAT, considérons l’affectation 
de valeurs de vérité correspondante. Dans x V y V z V'#, si x et y sont tous deux à 1, 
on affecte uc à 1 ; sinon si x et y sont tous les deux à 0, on affecte uc à D; sinon, on 
affecte à uc la valeur de vérité adéquate pour la clause uc V z V t. Cela produit une 
assignation démontrant que F” est une instance positive de NAE3SAT. 

Là encore la réduction est polynomiale, et NAE3SAT est dans NP de façon triviale. 


12.1.2 Autour de STABLE 


Définition 12.3 (STABLE) 
Donnée: Un graphe G = (V,E) non-orienté et un entier k. 
Réponse: Décider s’il existe V' C V, avec|V'| = k, tel que u,v € V' = (u,v) & 
E. 


Théorème 12.3 Le problème STABLE est NP-complet. 


Démonstration: STABLE est bien dans NP, car la donnée de V’ est un certificat 
facilement vérifiable en temps polynomial. 

On va réduire le problème 3 — SAT à STABLE, c’est-à-dire, étant donné une for- 
mule F du type 3 — SAT, construire en temps polynomial un graphe G, de sorte que 
l’existence d’un stable dans G soit équivalente à l’existence d’une affectation de va- 
leurs de vérité qui satisfait F. 

Soit F = Aic;cz(ri; V t2j V x3;). On construit un graphe G avec 3k sommets, 
un pour chaque occurrence d’un littéral dans une clause. 

— Pour chaque variable x; de 3 — SAT, G possède une arête entre chaque sommet 
associé à un littéral x; et chaque sommet associé à un littéral -x; (ainsi un stable 
de G correspond à une affectation de valeurs de vérité à une partie des variables) ; 

— Pour chaque clause C, on associe un triangle : par exemple pour une clause de 
F de la forme C — (x1 V -x2 V x3), alors G possède les arêtes (1,22), 
(-22,23), (x3,%1) (ainsi un stable de G contient au plus un des trois sommets 
associés à la clause C). 

Soit k le nombre de clauses dans F. On démontre que Fest satisfiable si et seule- 

ment si G possède un stable de taille K. 

En effet, si Fest satisfiable, on considère une assignation des variables satisfaisant 
F. Pour chaque clause C’ de F, on choisit yc un littéral de C’ rendu vrai par l’assigna- 
tion : cela définit k sommets formant un stable de G. 

Réciproquement, si G a un stable de taille k, alors il a nécessairement un sommet 
dans chaque triangle. Ce sommet correspond à un littéral rendant la clause associée 
vraie, et forme une assignation des variables cohérente par construction des arêtes. 

La réduction est clairement polynomiale. 

Deux problèmes classiques sont reliés à STABLE. 
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Définition 12.4 (CLIQUE) 
Donnée: Un graphe G = (V,E) non-orienté et un entier k. 
Réponse: Décider s’il existe V' € V, avec |V'| = k, tel que u,v € V' = (u,v) € 
E. 


Théorème 12.4 Le problème CLIQUE est NP-complet. 


Démonstration: La réduction à partir de STABLE consiste à passer au complé- 
mentaire sur les arêtes. En effet, il suffit de prouver qu’un graphe G — (VE) a 
un stable de taille k si et seulement si son graphe complémentaire G = (V, E) (où 
E = {(u,v)|(u,v) # E} a une clique de taille k. 


Définition 12.5 (RECOUVREMENT DE SOMMETS) 
Donnée: Un graphe G = (V,E) non-orienté et un entier k. 
Réponse: Décider s’il existe V' C V, avec |[V'| < k, tel que toute arête de G ait 
au moins une extrémité dans V'. 


Théorème 12.5 Le problème RECOUVREMENT DE SOMMETS est NP-complet. 


Démonstration: La réduction à partir de STABLE consiste à passer au complé- 
mentaire sur les sommets. 


Définition 12.6 (COUPURE MAXIMALE) 
Donnée: Un graphe G = (V,E) non-orienté et un entier k. 
Réponse: Décider s’il existe une partition V = ViUVA telle que le nombre d’arêtes 
entre V\ et Va soit au moins k. 


Théorème 12.6 Le problème COUPURE MAXIMALE est NP-complet. 


Démonstration: On réduit NAE3SAT à COUPURE MAXIMALE. Supposons donc 
donnée une instance de NAE3SAT, dans laquelle on peut supposer sans perte de géné- 
ralité qu’une clause ne contient pas simultanément une variable et son complémentaire. 
Quitte à remplacer uw V v par ((u V vu V w) À (u V v V -w)), on peut aussi suppo- 
ser que chaque clause contient exactement 3 littéraux. Enfin, si l’on a deux clauses 
(u V v V w) et (u V v V z), on peut, en introduisant deux variables t: et {2 et en pro- 
cédant comme pour réduire NAF4SATà NAE3SAT, réécrire ces deux clauses comme 
Qu V ti Vt2) À (vu V'w V =t1) À (vu V z V -t2). Bref, on peut donc supposer que deux 
clauses données ont au plus une variable en commun. 

On note x1,--- ,7, les variables de la formule F. 

On va construire un graphe G = (V, E) de la façon suivante : G possède 2n som- 
mets où pour chaque variable u de F', correspondent deux sommets w et —u. G& possède 
une arête entre chaque couple de sommets (u, v) tels que u et v apparaissent dans la 
même clause, et une arête entre les sommets u et —u pour toute variable u. 

Les réductions dans le premier paragraphe de la preuve permettent de voir qu’à 
chaque clause correspond un triangle et que deux de ces triangles ont des arêtes dis- 
tinctes. 

Si on note n le nombre de variables, et m le nombre de clauses, le graphe G a donc 
2n sommets et 3m + n arêtes. Il est alors facile de voir que le nombre d’arêtes dans une 
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coupure correspondant à une affectation NAE3SAT valide est 2m + n : l’arête entre u 
et —u pour chaque variable u, et deux des arêtes du triangle uvw pour chaque clause 
u Vu V w. 


Inversement, toute coupure de Ga au plus (2m +n) arêtes, car une coupure ne peut 
inclure que deux arêtes par triangle associé à une clause. Par conséquent, une coupure 
de valeur 2m + n fournit immédiatement une affectation NAE3SAT valide. 

En d’autres termes, résoudre l’instance de NAE3SAT revient à résoudre COU- 
PURE MAXIMALE sur (G,2m + n). 

La réduction étant polynomiale, et puisque COUPUREMAXIMALE est dans NP 
car la donnée de VA est un certificat valide vérifiable en temps polynomial. 


12.13 Autour de CIRCUIT HAMILTONIEN 


Le problème CIRCUIT HAMILTONIEN est souvent à la base de propriétés liées 
aux chemins dans les graphes (nous reprenons la définition de ce problème, même s’il 
a déjà été défini dans le chapitre précédent). 


Définition 12.7 (CIRCUIT HAMILTONIEN) 
Donnée: Un graphe G = (V, E) (non-orienté),. 
Réponse: Décider s’il existe un circuit hamiltonien, c’est-à-dire un chemin de G 
passant une fois et une seule par chacun des sommets et revenant à son point de 
départ. 


Théorème 12.7 Le problème CIRCUIT HAMILTONIEN est NP-complet. 


Démonstration: On va démontrer ce fait en réduisant RECOUVREMENT DE 
SOMMETS à ce problème. 


La technique consiste à construire, partant d’une instance de RECOUVREMENT 
DE SOMMETS, un graphe dans lequel chaque arête initiale sera remplacée par un 
“motif” admettant exactement deux chemins hamiltoniens, c’est-à-dire des chemins 
visitant une fois et une seule chaque sommet. L’un de ces deux chemins correspondra 
au cas où le sommet correspondant appartient à la couverture, l’autre au cas où il n’y 
appartient pas. 

Il reste ensuite à préciser comment recoller ces différents motifs pour qu’un circuit 
hamiltonien global corresponde exactement à une réunion de chemins hamiltoniens à 
travers chaque motif, et pour assurer qu’on obtient bien le bon résultat au problème 
RECOUVREMENT DE SOMMETS initial en résolvant CIRCUIT HAMILTONIEN 
dans ce graphe. 

Notons (G = (V,E),k) l'instance de RECOUVREMENT DE SOMMETS étu- 
diée. 


Le motif que nous allons utiliser est le suivant : 
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U1 U2 U3 UA U5 U6 


V1 V2 V3 V4 U5 V6 


Pour obtenir un parcours de ce motif traversant une fois et une seule chaque som- 
met, seules deux solutions sont possibles : soit un passage en deux fois, une fois 
UuauzUuaUsUG puis ultérieurement vivavzvavs ve (dans un sens ou dans l’autre) ; ou 
alors un passage en une seule fois Uu2U3V1vaVavavs VeUuaus Us (ou le même en inver- 
sant les u et les v). 

À chaque arête (u, v) du graphe de départ, on associe un motif de ce type, en faisant 
correspondre le sommet u au côté u et le sommet v au côté v. On raccorde ensuite entre 
eux bout à bout tous les côtés de tous les motifs correspondant à un même sommet ; on 
forme donc une chaîne associée à un sommet donné, avec encore deux “sorties” libres. 
On raccorde alors chacune de ces deux sorties à k nouveaux sommets 51,--- ,s7. On 
note le graphe ainsi construit A dans la suite. 

Supposons maintenant donné un recouvrement du graphe initial de taille k, dont les 
sommets sont {g1,--- ,gK}. On peut alors construire un circuit hamiltonien de H de la 
façon suivante : 

— partir de 51; 

— parcourir la chaîne g de la façon suivante. Quand on traverse une arête (g1,h), 
si h est aussi dans la couverture, on traverse simplement le côté g;, sinon, on 
parcourt les deux côtés simultanément ; 

— une fois la chaîne 91 finie, on revient en s2 et on repart par g2 et ainsi de suite. 

Il est clair que tous les sommets s4 sont atteints une fois et une seule. 

Considérons un sommet À du motif correspondant à une arête (u, v). On peut tou- 
jours supposer que u est dans la couverture, disons uw = g1. Il s’ensuit que si h est du 
côté de u, h sera atteint une fois au moins. On voit en vertu du second item qu’il ne sera 
plus atteint dans la suite. Si h est du côté de v, et que v n’est pas dans la couverture, 
h est parcouru lors du parcours de u. Si v = g;, h est parcouru lors du parcours de 
la chaîne correspondant à g; et à ce moment-là seulement. On a donc bien un circuit 
hamiltonien. 

Réciproquement, supposons que l’on dispose d’un circuit hamiltonien de H. La 
construction de notre motif impose que venant d’un sommet s;, on traverse entièrement 
une chaîne u puis l’on passe à un autre des sommets s;. On traverse ainsi & chaînes ; 
les & sommets correspondants forment alors une couverture. En effet, si (u, v) est une 
arête, le motif correspondant est parcouru par le chemin hamiltonien ; or il ne peut 
l’être que lors du parcours d’une boucle correspondant à une des deux extrémités de 
l’arête. 

Enfin, la réduction est trivialement polynomiale. CIRCUIT HAMILTONIEN est 
donc bien NP-complet. 

Comme dans la section précédente, on peut alors en déduire la NP-complétude de 
nombreuses variantes. 
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Définition 12.8 (VOYAGEUR DE COMMERCE) 
Donnée: Un couple (n, M), où M est une matrice n X n d’entiers et un entier k. 
Réponse: Décider s’il existe une permutation 7 de [1,2,--- ,n] telle que 


D Matra) <k: 
1<i<n 


Corollaire 12.2 Le problème VOYAGEUR DE COMMERCE est NP-complet. 


Ce problème porte ce nom, car on peut voir cela comme l’établissement de la tour- 
née d’un voyageur de commerce devant visiter n villes, dont les distances sont données 
par la matrice M de façon à faire moins de k kilomètres. 


Démonstration: 
On réduit CIRCUIT HAMILTONIEN à VOYAGEUR DE COMMERCE. Pour ce 
faire, étant donné un graphe G = (V,E), on pose V = {x1,--- ,x,}. On considère 


alors la matrice M n x n d’entiers telle que 


m.-(1 iGier; 
#77 | 2 sinon. 


Montrons alors que CIRCUIT HAMILTONIEN(V, E) ssi VOYAGEUR DE COMMERCE{(n, M,n). 
S’il existe un circuit hamiltonien dans G on peut en effet construire la permutation 

7 comme décrivant l’ordre de parcours des sommets du graphe G : par construction, la 

somme des distances des arêtes sur ce circuit vaudra n. 
Inversement, étant donnée une permutation avec cette propriété, le fait que les n —1 

termes de la somme soient au moins égaux à 1 implique qu’ils sont tous égaux à 1, et 

donc que les arêtes (T(4), m(i+1)) existent dans le graphe G' : on a donc bien un circuit 

hamiltonien. 


Définition 12.9 (CIRCUIT LE PLUS LONG) 
Donnée: Un graphe G = (V, E) non-orienté, avec des distances sur chaque arète, 
un entier T. 
Réponse: Décider s’il existe un circuit de G ne passant pas deux fois par le même 
sommet dont la longueur est > r. 


Corollaire 12.3 Le problème CIRCUIT LE PLUS LONG est NP-complet. 


Démonstration: On construit une réduction à partir de CIRCUIT HAMILTONIEN : 
pour cela, à un graphe G pour CIRCUIT HAMILTONIEN, on associe à chaque arête 
le poids 1. La recherche d’un cycle hamiltonien est alors trivialement identique à la 
recherche d’un circuit de longueur > n dans le graphe. 


12.1.4 Autour de 3-COLORABILITE 


Nous avons déjà définit ce que nous appelions un (bon) coloriage de graphes dans 
le chapitre précédent. Le plus petit entier k tel qu’un graphe soit (bien) coloriable est 
appelé le nombre chromatique du graphe. 

Il est connu que les graphes planaires sont toujours coloriables avec 4 couleurs. 
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Définition 12.10 (3-COLORABILITE) 
Donnée: Un graphe G = (V,E) non-orienté. 
Réponse: Décider s’il existe un coloriage du graphe utilisant au plus 3 couleurs. 


Théorème 12.8 Le problème 3-COLORABILITE est NP-complet. 


Démonstration: 3-COLORABILITE est dans NP, car la donnée des sommets co- 
lorés par chacune des 3 couleurs constitue un certificat vérifiable en temps polynomial. 

On va réduire 3-SAT à 3-COLORABILITE. On se donne donc une conjonction de 
clauses à 3 littéraux, et il nous faut à partir de là construire un graphe. Comme dans les 
autres réductions de 3-SAT, il faut parvenir à traduire deux contraintes : une variable 
peut prendre la valeur 0 ou 1 d’une part, et les règles d’évaluation d’une clause d’autre 
part. 

On construit un graphe ayant 3 + 2n + 5m sommets, les trois permiers sont notés 
VRAI, FAUX, NSP. Ces trois sommets sont reliés deux à deux en triangle, de 
sorte qu’ils doivent être tous trois de couleurs différentes. On appellera les couleurs 
correspondantes V RAI, FAUX, NSP. 

On associe un sommet à chaque variable et au complémentaire de chaque variable. 
Pour assurer qu’une variable prenne la valeur V RAI ou F AU X, pour chaque variable 
x; On construit un triangle dont les sommets sont x;, -x;, et NSP. Cela impose que 
soit couleur(x;) = V RAI et couleur(-x;) = FAUX, ou couleur(x;) = FAUX 
et couleur(-x;) = VRAI. 

Il nous reste donc à encoder les règles d’évaluation d’une clause. Pour ce faire, on 
introduit le sous-graphe suivant, qui correspond à une clause x V y V z: 


Il est facile de voir que si ce motif (où les trois sommets distingués et les triangles 
construits sur les variables sont implicites) est 3-coloriable, alors les sommets 0 et 
1 sont FAUX et NSP. Si 1 est FAUX, comme un sommet correspondant à une 
variable doit être VRAI ou FAUX, on a couleur(z) = V RAI. Si 0 est FAUX, 
alors 2 ne peut pas être FAUX, donc 3 ou 4 l’est, et la variable correspondante est 
coloriée VRAI. 

Réciproquement, si l’une des variables est vraie, on peut facilement construire une 
3-coloration du motif. 

Considérons alors le graphe formé des trois sommets distingués, des triangles for- 
més sur les variables, et des motifs donnés. Si ce graphe est 3-coloriable, alors en 
particulier tout sous-graphe est coloriable. Les triangles de variables sont en particu- 
lier coloriables. À partir d’une 3-coloration du graphe, on construit une affectation de 
valeurs de vérité en mettant à 1 toutes les variables coloriées par V RAI. Cette affec- 
tation est cohérente (une variable et son complémentaire ont bien une valeur opposée) 
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et au moins une variable par clause est à 1, en vertu des propriétés du motif ci-dessus. 
Inversement, étant donné une affectation de valeurs de vérité, il est aisé de déduire une 
3-coloration du graphe. 

L'existence d’une 3-coloration du graphe est donc équivalente à la satisfaisabilité 
de la formule initiale. 

La réduction est manifestement polynomiale ; on a donc bien prouvé que 3-SAT se 
réduisait à 3-COLORABILITE ; ce dernier est donc bien NP-complet. 


12.15 Autour de SOMME DE SOUS-ENSEMBLE 


Définition 12.11 (SOMME DE SOUS-ENSEMBLE) 
Donnée: Un ensemble fini d’entiers E et un entier t. 
Réponse: Décider s’il existe E" C E tel que Ye x = t. 


Théorème 12.9 Le problème SOMME DE SOUS-ENSEMBLE est NP-complet. 


Démonstration: Le fait que SOMME DE SOUS-ENSEMBLE est dans NP vient 
du fait que la donnée de EF” constitue un certificat vérifiable en temps polynomial. 

On va maintenant réduire une version de RECOUVREMENT DE SOMMETS dans 
laquelle on cherche à construire une couverture de taille exactement k à SOMME DE 
SOUS-ENSEMBLE. II est facile de voir que cette version de RECOUVREMENT DE 
SOMMETS est essentiellement équivalente à la version classique, car il suffit de déci- 
der pour chaque ! < {, s’il existe une couverture de taille { pour savoir s’il existe une 
couverture de taille au plus Lo. 

On se donne un graphe G = (V, E) dans lequel on souhaite construire un recou- 
vrement de sommets de taille k. On numérote les sommets et arêtes ; soit B = (b;;) la 
matrice d’incidence sommets-arêtes, c’est-à-dire que b;; — 1 si l’arête à est incidente 
au sommet ÿ, b;; — 0 sinon. 

On va construire un ensemble F d’entiers, tel que chaque sommet corresponde à 
un entier de F. On veut pouvoir lire sur la somme des éléments d’un sous-ensemble les 
arêtes dont un des sommets au moins appartient au sous-ensemble, de façon à ce qu’on 
ait bien une couverture de sommets si et seulement si c’est le cas pour toutes les arêtes. 

Cela peut se faire en exprimant les entiers dans une base b à fixer ultérieurement, et 
en faisant correspondre au sommet s; l’entier ÿ° b;; bi. On veut aussi pouvoir compter 
le nombre de sommets présents dans la couverture, qui doit être égal à k ; pour ce faire, 
il suffit d’ajouter un terme b”, si les arêtes sont numérotées de 0 à n — 1. 

Il subsiste une difficulté : pour qu’un sous-ensemble de somme t — D}; aib° 
corresponde à une couverture de sommets, le choix que l’on vient juste de faire impose 
que (noter que tous les a; sauf a, valent au plus 2, car une arête est incidente à deux 
sommets exactement) : 

— An — k; 

— di > 1. 

Les spécifications du problème ne permettent pas de prendre en compte le second 
item. On peut contourner le problème en ajoutant à F les entiers b° correspondant à 
l’arête 1. 


192 CHAPITRE 12. QUELQUES PROBLÈMES NP-COMPLETS 


On peut alors choisir comme but 


n—1 


t= kb + N 2b. (12.1) 


i=0 


À ce stade, on va imposer que la base b soit au moins égale à 4; comme dans 
toute somme d’éléments de F il y a au plus trois termes b° pour à < n, cela entraîne 
qu'aucune retenue ne peut se produire dans l’addition (on permet toujours au coeffi- 
cient de b”* d’excéder b — 1), et donc que l’on peut lire sur l’équation le nombre 
d’occurrences du terme b'. 

Pour tout sous-ensemble F” de somme t, on a donc : 

— il y a k termes correspondant à des sommets dans F” (cf. le terme en b” pour 

chaque arête à) ; 

— F' contient au moins un terme correspondant à une des deux extrémités de 1; 
en effet, t contenant 2 termes b?, il peut contenir soit les deux extrémités de 
l’arête, soit l’entier correspondant à l’arête et celui correspondant à l’une des 
deux extrémités. 

Inversement, étant donnée une couverture de sommets, on construit l’ensemble F” 
en prenant les sommets de la couverture, et les arêtes dont un seul des deux sommets 
est dans la couverture. 

On a donc bien réduit RECOUVREMENT DE SOMMETS à SOMME DE SOUS- 
ENSEMBLE. 

Il est facile de voir que la réduction s’effectue en temps polynomial, et donc que 
l’on a bien prouvé le théorème. 

On peut en déduire : 


Définition 12.12 (SAC A DOS) 
Donnée: Un ensemble de poids a1,:-- ,an, un ensemble de valeurs v1,--- , Un, 
un poids limite À, et un entier V. 
Réponse: Décider s’il existe E" € {1,2,--- ,n}telque Yep &i < AetŸ ep i > 
V. 


Corollaire 12.4 Le problème SAC A DOS est NP-complet. 
Démonstration: A partir de SOMME DE SOUS-ENSEMBLE : étant donnée E = 


{e1,--- ,e, } et t une instance de SOMME DE SOUS-ENSEMBLE, on considère v; — 
a =e,etV = A=t. 


Définition 12.13 (PARTITION) 
Donnée: Un ensemble fini d’entiers E. 
Réponse: Décider s’il existe EC E tel que Yep ? = Dep ?. 


Théorème 12.10 Le problème PARTITION est NP-complet. 


Démonstration: On va réduire SOMME DE SOUS-ENSEMBLE à PARTITION. 
Soit (E,t) une instance de SOMME DE SOUS-ENSEMBLE. On pose S = Dept. 
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Quitte à changer t en S — { (ce qui revient à changer l’ensemble obtenu en son com- 
plémentaire), on peut supposer que 2t < S. 

L’idée naturelle consisterait à ajouter l’élément u — S — 2t à FE; le résultat de 
partition serait alors deux sous-ensembles (4’ et son complémentaire) de somme S —t; 
l’un des deux contient l’élément S — 2+, donc en enlevant ce dernier, on trouve un 
ensemble de termes de Æ de somme t. Malheureusement, cette technique échoue si 
S — 2t est déjà dans E. 

Au lieu de cela, on prend le nombre X = 2$ et X’ — S + 24, et on applique 
PARTITION à E' = EU {X, X'}. Il existe une partition de E” si et seulement s’il 
existe un sous-ensemble de Æ de somme t. En effet, s’il existe une partition de FE, 
il existe deux sous-ensembles complémentaires de somme 2$ + {. Chacun des deux 
sous-ensembles doit contenir soit X, soit X”, car sinon sa somme ne peut excéder 
2$ + t; donc un des deux ensembles contient X et non X’, et on obtient en enlevant 
X un sous-ensemble F de E de taille t. Réciproquement, étant donné un tel F, (FU 
{X},E — FU{X"}) constitue une partition de E”. On a donc bien réduit SOMME 
DE SOUS-ENSEMBLE à PARTITION. 

Reste à justifier que la réduction est bien polynomiale. L’essentiel de la réduction 
est le calcul de A et À’, qui est bien polynomial en la taille des entrées (l’addition de k 
nombres de n bits se fait en temps O(klog n)). 


12.2 Exercices 
12.2.1 Variantes polynomiales 


Exercice 12.1. Un graphe G = (V, E) est dit Eulérien s’il existe un cycle empruntant 
exactement une fois chaque arête du graphe G. 

Montrer qu'un graphe connexe est Eulérien si et seulement si chacun de ses som- 
mets a un degrée pair. 

Proposer un algorithme polynomial qui détermine si le graphe est Eulérien. 


Exercice 12.2. 
On s'intéresse à 2SAT. 


1. Proposer une valuation t qui satisfait D1(u1,u2,u3) = (ua V —u3) À (ua V 
u3) À (ua V ui). 

2. Que se passe-t-il pour pa(ui, u2) = (ua V us) À (-u2 V us) À (us V uw) A 
(—u3 V —u1) ? 


3. Montrer que u V v = (-u = v) À (-v = u). 
A partir d’une instance de 2SAT nous construisons un graphe orienté G3 = 
(V, E) avec 
— un sommet par littéral 
— et un arc par implication (en transformant chaque clause par deux implica- 
tions) 


4. Dessiner les graphes G4, et Go. 
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5. Montrer qu'il existe une variable u telle que G4 contient un cycle entre u vers 
—u dans G, si et seulement si ® n’est pas satisfiable. 


6. Montrer que 2-S AT peut se résoudre en temps polynomial. 


Exercice 12.3. [Chevaliers de la table ronde] Etant donnés n chevaliers, et connais- 
sant toutes les paires de féroces ennemis parmi eux, est-il possible de les placer autour 
d’une table circulaire de telle sorte qu'aucune paire de féroces ennemis ne soit côte à 
côte ? 


12.22 NP-complétude 


Exercice 12.4. 


Définition : une chaîne hamiltonienne est une chaîne qui passe une fois et une seule 
par chaque sommet du graphe. 

Prouver que le problème suivant est NP-complet. 
CHAINE HAMILTONIENNE 
Données : un graphe non-orienté G de n sommets, deux sommets u et v distincts de G. 
Question : G contient-il une chaine hamiltonienne dont ses extrémités sont les sommets 
uetv ? 


Exercice 12.5. Prouver que le problème suivant est NP-complet. 

CHAÎNE 

Données : un graphe non-orienté G de n sommets, deux sommets u et v distincts de G. 
Question : G contient-il une chaine de longueur n/2 entre u et v ? 


Exercice 12.6. Prouver que le problème suivant est NP-complet. 
Problème ARBRE 
Données : Un graphe G = (V,E), et un entier k. 
Question : Existe-t-il un arbre couvrant tous les sommets de G ayant moins de k 
feuilles ? 


Exercice 12.7. Soit G = (V, E) un graphe. 
— Une couverture de sommets S du graphe G est un sous-ensemble de sommets tel 
que toutes les arêtes de G sont incidentes à au moins un sommet de S. 
— Un ensemble dominant C' du graphe G est un sous-ensemble de sommets tel que 
tout sommet est soit dans C soit voisin d’un sommet de C!. 
Soit G — (V,E) un graphe connexe. Nous allons construire un graphe G — 
(V',E") à partir de G tel que 
- V'=VUE; 
- E = EU{(v,a)lve Vae E,v est extremité de l’arête a dans G} 


1. Montrer que si S est une couverture de sommets du graphe G, alors S est un 
ensemble dominant de G". 
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Graphe G Graphe G” (sans les arêtes de G) 


2. Montrer que si S' est un ensemble dominant de G", alors il existe une couverture 
S € V du graphe Get de cardinalité inférieure ou égale à S”. 


3. Exprimer le problème de minimisation de l’ensemble dominant sous forme de 
problème de décision. 
4. Montrer que ce problème est dans NP. 


5. Montrer que ce problème est dans NP-complet. 


Exercice 12.8. Nous allons nous concentrer sur le problème du k-centre : étant donné 
un ensemble de villes dont les distances sont spécifiées, choisir k villes afin d'installer 
des entrepôts de façon à minimiser la distance maximale d’une ville à l’entrepôt le plus 
proche. Un tel ensemble de k villes est appelé k-centre. 

Le problème associé de décision est le suivant : 
Problème k-CENTRE 
Données : un graphe complet K = (V,E) muni d’une fonction de poids w sur les 
arêtes, et des entiers strictement positifs k et b. 
Question : Existe-il un ensemble S de sommets tel que |S| = k et tel que tout sommet 
v de V satisfait la condition suivante 


min{w(v,u):ueS}<b 


1. Montrer que k-CENTRE est dans NP 
2. Montrer que k-CENTRE est NP-complet sachant que DOMINANT est NP-complet. 


12.3 Notes bibliographiques 
Lectures conseillées Le livre [Garey and Johnson, 1979] recense plus de 300 pro- 


blèmes NP-complets et est d’une lecture assez agréable. On peut trouver plusieurs 
mises à jour de cette liste sur le web. 


Bibliographie Ce chapitre est repris du polycopié |Cori et al., 2010] du cours INF550 
de l’école polytechnique. 
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Chapitre 13 


Combplexité en espace mémoire 


Dans ce chapitre, on s’intéresse à une autre ressource critique dans les algorithmes : 
la mémoire. En fait, en théorie de la complexité, on parle plutôt d'espace, ou d’espace 
mémoire, pour désigner la mémoire. 

On va commencer par voir comment on mesure la mémoire utilisée par un algo- 
rithme. On introduira alors les principales classes considérées en théorie de la com- 
plexité. 


13.1 Espace polynomial 


Dans toute cette section, nous énonçons un ensemble de définitions et de théorèmes 
sans preuve. Les preuves sont données dans la section suivante. 
Introduisons l’analogue de TIME(t(n)) pour la mémoire : 


Définition 13.1 (SPACE(t(n))) Soit t : N — N une fonction. On définit la classe 
SPACE(t(n)) comme la classe des problèmes (langages) qui sont décidés par une 
machine de Turing en utilisant O(t(n)) cases du ruban, où n est la taille de l'entrée. 


13.1.1 Classe PSPACE 


On considère alors la classe des problèmes décidés en utilisant un espace mémoire 
polynomial. 


Définition 13.2 PSPACE est la classe des problèmes (langages) décidés en espace 
polynomial. En d’autres termes, 


PSPACE = | J SPACE(n*). 
kEN 


Remarque 13.1 Comme dans le chapitre[T1] on pourrait observer que cette notion ne 
dépend pas réellement du modèle de calcul utilisé, et que l’utilisation des machines de 
Turing comme modèle de base est relativement arbitraire. 
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On peut aussi introduire l’analogue non déterministe : 


Définition 13.3 (NSPACE{(t(n))) Soit t : N — N une fonction. On définit la classe 
NSPACE{(t(n)) comme la classe des problèmes (langages) qui sont acceptés par une 
machine de Turing en utilisant O(t(n)) cases du ruban sur chacune des branches du 
calcul, où n est la taille de l’entrée. 


Il serait alors naturel de définir 


NPSPACE = | J NSPACE(n*), 
kEN 


mais il s’avère que la classe NPSPACE n’est autre que PSPACE. 
Théorème 13.1 (Théorème de Savitch) NPSPACE — PSPACE. 


La preuve de ce résultat se trouve dans la section|13.10 


13.1.2 Problèmes PSPACE-complets 


La classe PSPACE possède des problèmes complets : le problème QSAT (aussi 
appelé QBF) consiste, étant donnée une formule du calcul propositionnel en forme 
normale conjonctive ® avec les variables x1,x%2,--- ,xA (c’est-à-dire une instance de 
SAT), à déterminer si 221Vx21x3 + O(x1,-- ,æn)? 


Théorème 13.2 Le problème QSAT est PSPACE-complet. 


Nous ne prouverons pas ce résultat dans ce document. 

Les jeux stratégiques sur les graphes donnent naturellement naissance à des pro- 
blèmes PSPACE-complet. 

Par exemple, le jeu GEOGRAPHY consiste à se donner un graphe orienté (fini) 
G = (V,E). Le joueur 1 choisit un sommet u: du graphe. Le joueur 2 doit alors 
choisir un sommet vw. tel qu’il y ait un arc de u, vers v1. C’est alors au joueur 1 de 
choisir un autre sommet u2 tel qu’il y ait un arc de v1 vers u2, et ainsi de suite. On n’a 
pas le droit de repasser deux fois par le même sommet. Le premier joueur qui ne peut 
pas continuer le chemin uviuaus - + perd. Le problème GEOGRAPHY consiste à 
déterminer étant donné un graphe G et un sommet de départ pour le joueur 1, s’il existe 
une stratégie gagnante pour le joueur 1. 


Théorème 13.3 Le problème GEOGRAPHY est PSPACE-complet. 


13.2 Espace logarithmique 


Il s’avère que la classe PSPACE est énorme et contient tout P et aussi tout NP : 
imposer un espace mémoire polynomial est donc souvent peu restrictif. 

C’est pourquoi on cherche souvent plutôt à parler d’un espace logarithmique : mais 
cela introduit une difficulté et un problème dans les définitions : en effet, une machine 
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de Turing utilise au moins les cases qui contiennent son entrée, et donc la définition 
[13.1]ne permet pas de parler de fonctions t(n) < n. 

C’est pour cela que l’on modifie cette définition avec la convention suivante : 
lorsque l’on mesure l’espace mémoire utilisé, par convention, on ne compte pas les 
cases de l’entrée. 

Pour le faire, proprement, il faut donc remplacer la définition[13.1]par la suivante : 


Définition 13.4 (SPACE(t(n))) Soit t : N — N une fonction. On définit la classe 
SPACE(t(n)) comme la classe des problèmes (langages) qui sont décidés par une 
machine de Turing qui utilise deux rubans : 

— le premier ruban contient l'entrée et est accessible en lecture seulement : il peut 

être lu, mais il ne peut pas être écrit ; 

— le second est lui initialement vide et est accessible en lecture et écriture ; 
en utilisant O(t(n)) cases du second ruban, où n est la taille de l'entrée. 

On définit NSPACE(t(n)) avec la même convention. 


Remarque 13.2 Cette nouvelle définition ne change rien aux classes précédentes. Elle 
permet simplement de donner un sens aux suivantes. 


Définition 13.5 (LOGSPACE) La classe LOGSPACE est la classe des langages et 
des problèmes décidés par une machine de Turing en espace logarithmique. En d’autres 
termes, 


LOGSPACE = SPACE(log(n)). 
Définition 13.6 (NLOGSPACE) La classe NLOGSPACE est la classe des langages 


et des problèmes décidés par une machine de Turing en espace non déterministe loga- 
rithmique. En d’autres termes, 


NLOGSPACE = NSPACE(log(n)). 
Il s’avère que l’on a: 
Théorème 13.4 LOGSPACE C NLOGSPACE C P C NP C PSPACE. 
On sait par ailleurs que NLOGSPACE € PSPACE mais on ne sait pas lesquelles 


des inclusions intermédiaires sont strictes. 


13.3 Quelques résultats et démonstrations 


Cette section est consacrée à prouver un certain nombre des principaux résultats 
de la théorie de la complexité, en particulier sur les liens entre temps et mémoire. 
Observons que le théorème|13.4|découle des résultats qui suivent. 
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EXPTIME 


PSPACE 


P 


NLOGSPACE 


FIGURE 13.1 — Inclusions entre les classes de complexité 


13.3.1 Préliminaires 


Pour éviter de compliquer inutilement certaines preuves, nous nous limiterons à 
des fonctions f(n) de complexité propre : on suppose que la fonction f(n) est non 
décroissante, c’est-à-dire que f(n + 1) > f(n), et qu’il existe une machine de Turing 
qui prend en entrée w et qui produit en sortie 1/(") en temps O(n + f(n)) et en espace 


O(F(n)), où n = [wl. 


Remarque 13.3 Cela n’est pas vraiment restrictif, car toutes les fonctions usuelles 


non décroissantes, comme log(n), n, n°, ---, nlogn, n! vérifient ces propriétés. En 


outre, ces fonctions sont stables par somme, produit, et exponentielle. 


Remarque 13.4 Nous avons besoin de cette hypothèse, car la fonction f(n) pourrait 
ne pas être calculable, et donc il pourrait par exemple ne pas être possible d'écrire un 
mot de longueur f(n) dans un des algorithmes qui suivent. 


Remarque 13.5 Dans la plupart des assertions qui suivent, on peut se passer de cette 
hypothèse, au prix de quelques complications dans les preuves. 
13.3.2 Relations triviales 

Un problème déterministe étant un problème non déterministe particulier, on a : 


Théorème 13.5 SPACE({(n)) € NSPACE({{(n)). 
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D'autre part : 
Théorème 13.6 TIME(f(n)) C SPACE(f(n)). 


Démonstration: Une machine de Turing écrit au plus une case à chaque étape. L’es- 
pace mémoire utilisé reste donc linéaire en le temps utilisé. Rappelons que l’on ne 
compte pas l’entrée dans l’espace mémoire. 


13.3.3 Temps non déterministe vs déterministe 
De façon plus intéressante : 


Théorème 13.7 Pour tout langage de NTIME(f(n)), il existe un entier c tel que ce 
langage soit dans TIME(c!)), Si l’on préfère : 


NTIME({(n)) € | J TIME(c)). 
ceN 


Démonstration (principe): Soit L un problème de NTIME(f(n)). En utilisant le 
principe que l’on a utilisé dans le chapitre précédent, on sait qu’il existe un problème 
À tel que pour déterminer si un mot w de longueur n est dans L, il suffit de savoir s’il 
existe un mot u € X* avec (w,u) € À, ce dernier test pouvant se faire en temps f(n), 
où n — |w|. Puisqu’en temps f(n) on ne peut pas lire plus que f(n) lettres de u, on 
peut se limiter aux mots u de longueur f(n). Tester si (w,u) € A pour tous les mots 
u € X* de longueur f(n) se fait facilement en temps O(c/())xO(f(n)) = O(c/(")), 
où c > 1 est le cardinal de l’alphabet Y de la machine : tester tous les mots u peut par 
exemple se faire en comptant en base c. 


Remarque 13.6 Pour écrire le premier u à tester de longueur f(n), nous utilisons le 
fait que cela doit être possible : c’est le cas, si l’on suppose f(n) de complexité propre. 
On voit donc l'intérêt ici de cette hypothèse implicite. Nous éviterons de discuter ce 
type de problèmes dans la suite, qui ne se posent pas de toute façon pour les fonctions 
f(n) usuelles. 


13.3.4 Temps non déterministe vs espace 
Théorème 13.8 NTIME({(n)) € SPACE({(n)). 


Démonstration: On utilise exactement le même principe que dans la preuve pré- 
cédente, si ce n’est que l’on parle d’espace. Soit L un problème de NTIME{(f(n)). En 
utilisant la même idée que dans le chapitre précédent, on sait qu’il existe un problème 
À tel que pour déterminer si un mot w de longueur n est dans L, il suffit de savoir s’il 
existe u € X* de longueur f(n) avec (w,u) € À : on utilise un espace O(f(n)) pour 
générer un à un les mots u € X* de longueur f(n) (par exemple en comptant en base 
c) puis on teste pour chacun si (w,u) € À, ce dernier test se faisant en temps f(n), 
donc espace f(n). Le même espace pouvant être utilisé pour chacun des mots u, au 
total cela se fait au total en espace O(f(n)) pour générer les u plus O(f(n)) pour les 
tests, soit O(f(n)). 
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13.3.5 Espace non déterministe vs temps 


Le problème de décision REACH suivant jouera un rôle important : on se donne 
un graphe orienté G = (V, E), deux sommets u et v, et on cherche à décider s’il existe 
un chemin entre u et v dans G. On peut facilement se persuader que REACH est dans 
P. 

A toute machine de Turing M (déterministe ou non) est associé un graphe orienté, 
son graphe des configurations, où les sommets correspondent aux configurations et les 
arcs correspondent à la fonction d’évolution en un pas de M, c’est-à-dire à la relation 
+ entre configurations. 

Chaque configuration X peut se décrire par un mot [X] sur l’alphabet de la ma- 
chine : si on fixe l’entrée w de longueur n, pour un calcul en espace f(n), il y a moins 
de O(c/(")) sommets dans ce graphe G,,, où c > 1 est le cardinal de l’alphabet de la 
machine. 

Un mot w est accepté par la machine M si et seulement s’il y a un chemin dans 
ce graphe G,, entre l’état initial X[w] codant l’entrée w, et un état acceptant. On peut 
supposer sans perte de généralité qu’il y a une unique configuration acceptante X'*. 
Décider l’appartenance d’un mot w au langage reconnu par M est donc résoudre le 
problème REACH sur (G,, X[w], X*). 

On va alors traduire sous différentes formes tout ce que l’on sait sur le problème 
REACH. Tout d’abord, il est clair que le problème REACH se résout par exemple en 
temps et espace O(n?), où n est le nombre de sommets, par un parcours en profondeur. 

On en déduit : 


Théorème 13.9 Si f(n) > log n, alors 


NSPACE(f(n)) € [J TIME(c')). 
cEeN 


Démonstration: Soit L'un problème de NSPACE{(f{(n)) reconnu par la machine de 
Turing non déterministe M. Par la discussion plus haut, on peut déterminer si w € L 
en résolvant le problème REACH sur (Gw, X[w], X*) : on a dit que cela pouvait se 
fait en temps quadratique en le nombre de sommets, soit en temps O0), où 
c > 1 est le cardinal de l’alphabet de la machine. 


13.3.6 Espace non déterministe vs espace déterministe 


On va maintenant affirmer que REACH se résout en espace log? (n). 
Proposition 13.1 REACH € SPACE(log?n). 


Démonstration: Soit G — (V, E) le graphe orienté en entrée. Étant donnés deux 
sommets x et y de ce graphe, et à un entier, on note CHEMIN(x, y,i) si et seulement 
s’il y a un chemin de longueur inférieure à 2° entre x et y. On a (G,u,v) € REACH 
si et seulement si CHEMIN(u, v,log(n)), où n est le nombre de sommets. Il suffit 
donc de savoir décider la relation CHEMIN pour décider REACH. 
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L’astuce est de calculer CHEMIN(x, y,i) récursivement en observant que l’on 
a CHEMIN(x,y,i) si et seulement s’il existe un sommet intermédiaire z tel que 
CHEMIN(x,z2,i-—1)et CHEMIN(z,y,i— 1). On teste alors à chaque niveau de 
la récursion chaque sommet possible z. 

Pour représenter chaque sommet, il faut O(log(n)) bits. Pour représenter x, y, 1, 
il faut donc O(log(n)) bits. Cela donne une récurrence de profondeur log(n), chaque 
étape de la récurrence nécessitant uniquement de stocker un triplet x, y,4 et de tester 
chaque z de longueur O(log(n)). Au total, on utilise donc un espace O(log(n)) * 


Olog(n)) = O(log”(n)). 


Théorème 13.10 (Savitch) Si f(n) > log(n), alors 


NSPACE(f(n)) € SPACE(f(n)°). 


Démonstration: On utilise cette fois l’algorithme précédent pour déterminer s’il y 
a un chemin dans le graphe G,, entre X[w] et X*. 

On remarquera que l’on a pas besoin de construire explicitement le graphe G:, 
mais que l’on peut utiliser l’algorithme précédent à la volée : plutôt que d’écrire com- 
plètement le graphe G.,, et ensuite de travailler en lisant dans cette écriture du graphe 
à chaque fois s’il y a un arc entre un sommet X et un sommet X”, on peut de façon 
paresseuse, déterminer à chaque fois que l’on fait un test si Cy(X, X') = 1. 


Corollaire 13.1 PSPACE = NPSPACE. 


Démonstration: On a [J,-,4 SPACE(n®) € Un NSPACE(n°), par le théorème 
et Uen NSPACE(n°) € U,en SPACE(n*) € U,en SPACE(n°) par le théo- 
rème précédent. 


13.3.7 Espace logarithmique non déterministe 


En fait, on peut encore dire plus sur le problème REACH. 
Théorème 13.11 REACH € NLOGSPACE. 


Démonstration (principe): Pour déterminer s’il y a un chemin entre « et v dans 
un graphe G, on devine de façon non déterministe le chemin sommet par sommet. Cela 
nécessite uniquement de garder le sommet que l’on est en train de visiter en plus de 
u et de v. Chaque sommet se codant par O(log(n)) bits, l’algorithme est en espace 


O(log(n)). 


Définition 13.7 Soit C une classe de complexité. On note co-C pour la classe des lan- 
gages dont le complémentaire est dans la classe C. 


On parle ainsi de problème coNP, cONLOGSPACE, etc. 
En fait, on peut montrer : 
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Théorème 13.12 Le problème REACH est dans cONLOGSPACE. 
On en déduit : 
Théorème 13.13 NLOGSPACE = coNLOGSPACE. 


Démonstration: Il suffit de montrer que cONLOGSPACE € NLOGSPACE. 
L’inclusion inverse en découle car un langage L de NLOGSPACE aura son complé- 
mentaire dans CONLOGSPACE et donc aussi dans NLOGSPACE, d’où l’on déduit 
que L sera dans cONLOGSPACE. 

Maintenant, pour décider si un mot w doit être accepté par un langage de cONLOGSPACE, 
on peut utiliser la machine non déterministe du théorème précédent qui utilise un es- 
pace logarithmique pour déterminer s’il existe un chemin entre X[w] et X* dans le 
graphe G%. 

En fait, selon le même principe on peut montrer plus généralement. 


Théorème 13.14 Soit f(n) une fonction telle que f(n) > log(n). Alors 


NSPACE({(n)) = coNSPACE(#{(n)). 


13.4 Résultats de séparation 


13.4.1 Théorèmes de hiérarchie 


On dit qu’une fonction f(n) > log(n) est constructible en espace, si la fonction 
qui envoie 1” sur la représentation binaire de 1/(") est calculable en espace O(f(n)). 


La plupart des fonctions usuelles sont constructibles en espace. Par exemple, n°? 
est constructible en espace puisqu’une machine de Turing peut obtenir n en binaire en 
comptant le nombre de 1, et écrire n? en binaire par n’importe quelle méthode pour 
multiplier n par lui-même. L'espace utilisé est certainement en O(n?). 


Théorème 13.15 (Théorème de hiérarchie) Pour toute fonction f : N — N construc- 
tible en espace, il existe un langage L qui est décidable en espace O(f(n)) mais qui 
ne l’est pas en espace o(f(n)). 


Démonstration: On considère le langage (très artificiel) L qui est décidé par la 
machine B suivante : 

— sur une entrée w de taille n, B calcule f(n) en utilisant la constructibilité en 
espace de f, et réserve un espace f(n) pour la simulation qui va venir ; 

— si w n’est pas de la forme (A)10*, où (A) est le codage d’une machine À, alors 
la machine B refuse ; 

— sinon, B simule la machine À sur le mot w pendant au plus 2/(7) étapes pour 
déterminer si À accepte en ce temps avec un espace inférieur à f(n) : 
— si À accepte en ce temps et cet espace, alors B refuse ; 


13.4. RÉSULTATS DE SÉPARATION 205 


— sinon B accepte. 

Par construction, L est dans SPACE(f(n)), car la simulation n’introduit qu’un 
facteur constant dans l’espace nécessaire : plus concrètement, si À utilise un espace 
g(n) < f(n), alors B utilise un espace au plus cg(n) pour une constante c. 

Supposons que L soit décidé par une machine de Turing À en espace g(n) avec 
g(n) = o(f(n)). Il doit exister un entier no tel que pour n > no, on ait dg(n) < f(n) 
pour une constante d. Par conséquent, la simulation par B de À sera bien complète sur 
une entrée de longueur no ou plus. 

Considérons ce qui se passe lorsque B est lancée sur l’entrée (A)10”°. Puisque 
cette entrée est de taille plus grande que n5, B répond l'inverse de la machine À sur la 
même entrée. Donc B et À ne décident pas le même langage, et donc la machine À ne 
décide pas L, ce qui mène à une contradiction. 

Par conséquent L n’est pas décidable en espace o( f(n)). 

Autrement dit : 


Théorème 13.16 (Théorème de hiérarchie) Soient f, f" : N — N des fonctions construc- 
tibles en espace telles que f(n) = o(f'(n)). 
Alors l'inclusion SPACE(f) € SPACE(f') est stricte. 


Sur le même principe, on peut prouver : 


Théorème 13.17 (Théorème de hiérarchie) Soient f, f" : N — N des fonctions construc- 
tibles en espace telles que f(n) = o(f'(n)). 
Alors l'inclusion NSPACE(f) C NSPACE(f’) est stricte. 


13.42 Applications 


On en déduit : 
Théorème 13.18 NLOGSPACE C PSPACE. 


Démonstration: La classe NLOGSPACE est complètement incluse dans SPACE(log” n) 
par le théorème de Savitch. Hors cette dernière est un sous-ensemble strict de SPACE(n), 
qui est inclus dans PSPACE. 

Sur le même principe, on obtient : 


Définition 13.8 Soir 


EXPSPACE = | J SPACE(2" ). 
cEeN 


Théorème 13.19 PSPACE C EXPSPACE. 


Démonstration: La classe PSPACE est complètement incluse dans, par exemple, 
SPACE(n/°2(1)), Hors cette dernière est un sous-ensemble strict de SPACE(2"), qui 
est inclus dans EXPSPACE. 
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13.5 Exercices 


Exercice 13.1. Montrer que si tout langage NP-dur est PSPACE-dur alors PSPACE — 
NP. 


13.6 Notes bibliographiques 


Lectures conseillées Pour aller plus loin sur les notions évoquées dans ce chapitre, 


nous suggérons la lecture de [Sipser, 19971, [Papadimitriou, 1994] et de [Lassaigne and de Rougemont, 20041. 
Arora and Barak, 2009]. 


Un ouvrage de référence et contenant les derniers résultats du domaine est | 


Bibliographie Ce chapitre contient des résultats standards en complexité. Nous nous 
sommes essentiellement inspirés de leur présentation dans les ouvrages [Sipser, 1997 
et |[Papadimitriou, 1994]. 


Chapitre 14 


Solutions de certains exercices 


On trouvera dans ce chapitre les corrections de quelques un des exercices. Le lec- 
teur est invité à faire parvenir à bournez@lix.polytechnique.fr une rédaction de la solu- 
tion['|de tout exercice qui n’est pas corrigé dans ces pages, ou toute solution qui semble 
plus élégante que la solution présentée. 


Chapitre 


1.3. On peut écrire AN B° = (AN Af)U(ANB°) = AN(ASU B°) = AN(ANB)Y. 
De même ANC° = AN(ANCY. Donc AN B = ANC implique AN B° = ANCE. 

Puisque (X°)° — X pour toute partie X de FE, on en déduit que AN B° = ANC" 
implique À N (B°)° = AN (C°) implique AN B = ANC. 


1.5. La fonction f(x,y) = y+(0+1+2+:..+ (x + 7y)) énumère les éléments de 
N? conformément à la figure. 

La fonction f est bien bijective : soit n € N. Il existe un unique a € N tel que 
0O+1+...+a<n<0+1+:.:+(a+1).L'unique antécédent de n par f est donné 
par (æ,y) avecy=n—(0+1+...+a)etx = ay. 

Une autre bijection entre N°? et N est donnée par la fonction g : N? — N définie 
par g(x, y) = 2*(2y + 1) — 1. Le fait que ce soit une bijection découle du fait que tout 
nombre entier strictement positif est le produit d’une puissance de deux et d’un nombre 
impair. 


Chapitre 


2.3. Le raisonnement se fait par l’absurde. Considérons X = {k € N|P(k) est faux}. 
Si X est non vide, il admet un plus petit élément n. 


1. Si possible en IATEX. 
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Remarque : ne peut avoir n £ 0. En effet, on sait que pour n = 0, si en supposant 
pour tout entier 4 < 0 la propriété P(k) on déduit P(0), puisqu'il n’y a pas de k < 0, 
cela veut dire qu’on peut déduire P(0) sans aucune hypothèse. 

Ceci étant : P(n — 1), P(n — 2),..., P(0) doit être vrai par définition de X. On 
obtient une contradiction avec la propriété appliquée en n. 


2.4. On doit d’abord se convaincre que L*.M est solution de l’équation X = L.X UM. 
Pour M = {e}, cela revient à se convaincre que L* — L.L* U {e}. Cela découle 


de : 
Lee rS Seule se furzre 
neN n>1 n>0 

On en déduit pour M général que L*.M = L.L*.M U {e}.M, et donc que L*.M 
est bien solution de l’équation X = Z.X U M. 

Il reste à prouver que c’est l’unique solution. Soit X € X* vérifiant X = L.XUM. 

Pour prouver que L*.M € X, il suffit de prouver que pour tout entier n on a 
LM € X, puisque L*.M = (,,9 L.M. On prouve par récurrence sur n la pro- 
priété P(n) : L'.M C X. : 

P(0) est vraie car L°.M = {e}.M = M C MUL.X = X. 

Supposons P(n) vraie. On a L*1.M = L.L".M C L.X C LXUM = X. 
Donc P(n + 1) est vraie. 

Réciproquement, on montre par récurrence la propriété Q(n) : tout mot w de X de 
longueur n appartient à L*.M. Cela donne clairement l’inclusion contraire. 

Pour cela, on utilise le second principe d’induction. Supposons que pour tout k < 
n, Q(k) soit vraie. Soit w € X un mot de longueur n. Puisque X = L.X U M, donc 
cas sont à considérer. Soit w € M et on a diretement w € L*.M puisque M C L*.M. 

Soit w € L.X et on peut écrire w = u.v avec u € L, et vu € X. Puisque € & EL, la 
longueur de u est non-nulle. et donc la longueur de v est strictement plus petite que celle 
de w. Par hypothèse d’induction, on a v € L*.M. Donc w = u.v € L.L*.M C L*.M, 
ce qui prouve Q(n), et termine la démonstration. 


2.5. Le langage L des expressions entièrement parenthésées formées à partir d’identi- 
ficateurs pris dans un ensemble À et des opérateurs + et x correspond à la partie de 
E = (AU {+,x})* définie inductivement par 

(B) ACL; 

(De feL=(e+f)e L: 

(He feL=(exf)eL. 


2.6. La preuve est similaire à la preuve du théorème [2.4](qui est une généralisation de 
ce phénomène). 


2.7. Soit P(x) la propriété : “x est non-vide et sans sommet avec un seul fils non- 
vide”. Clairement, P(x) est vraie pour x — (, &, (). Si on suppose P(g) et P(d), pour 
g,d € ABS, clairement P(x) est aussi vraie pour x = (g, a, d). La première propriété 
est donc vérifiée. 

Soit P(x) la propriété n(x) = 2f(x) — 1. On a P(x) pour x = (0, a, (), puisque 
n(x) = 1,et f(x) = 1,et1=2%*x1—1. 


Supposons P(g) et P(d) pour g,d € ABS. Considérons x = (g,a,d). On a 
on =1+2% f(g)—1+2% f(d) —1 = 2x (f(g) + f(d)) —1 = 
2 + f(x) — 1. 


La propriété est donc vraie pour tout x € ABS. 


Chapitre 


3.17. Il est clair que la deuxième propriété implique la première : pour toute distribution 
de valeurs de vérité v, on a U(G') = 1 si G est une tautologie, et U(F') = 0 si -F en est 
une. Dans les deux cas, D((F = G)) = 1. 

Supposons maintenant que la deuxième propriété soit fausse. On peut choisir une 
distribution de valeurs de vérité v telle que ÿ(-F) = 0, et une distribution de valeurs 
de vérité v’ telle que v’(G) = 0. 

On définit une distribution de valeurs de vérité v’”, en posant pour chaque variable 
propsitionnelle x, v”’(x) = v(x) si x possède au moins une occurence dans F, et 
v"(x) = v'(x) si x ne possède aucune occurene dans F. Par construction cette dis- 
tribution de valeurs de vérité coïncide avec v sur F et v’ sur G. On en déduit que 
D'(F) = v(F) = 0etv”(G) = v'(G) = 0. Et donc v”((F = G)) = 0. La première 
propriété est donc nécessairement fausse. 


3.19. Il est clair que si un graphe est coloriable avec k-couleurs, chacun de ses sous- 
graphes est coloriable avec k-couleurs (les mêmes). La difficulté est de prouver la ré- 
ciproque. 

On introduit pour chaque couple (u,i) € V x {1,2,...,k} une variable proposi- 
tionnelle À,, ;. On construit un ensemble T° de formules du calcul propositionnel sur 
l’ensemble des variables À,, ; qui soit satisfiable si et seulement si G est k-coloriable : 
l’idée est que À,, ; code le fait que le sommet u est colorié avec la couleur i. L'ensemble 
l'est défini comme L = l'1 U L'2 U ls, où chacun des l'; exprime une contrainte : 

— pour [1 : chaque sommet possède une couleur : 


Ti = {Au VV Au glu € V}. 
— pour [2 : Chaque sommet n’a pas plus qu’une couleur : 
Pets A mem Ii<iIi<kiSIE 
— pour [3 : Chaque arête n’a pas ses extrémités d’une même couleur : 
Da = {Au A Aijlue V1<i<k,(u,v)e E}. 


En faisant ainsi, un graphe est coloriable avec k couleurs si et seulement si on peut 
satisfaire toutes les formules de L = T'; U Fo U l3. 

On va utiliser le théorème de compacité : Soit l'Y une partie finie de l'. Soient 
Vo = {u1,-- ,un} les sommets u tels que À, ; figure dans une des formules de To. 
Soit Go — (Vo, Eo) le sous-graphe déterminé par VW. 
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Si on suppose que l’on a un graphe dont tous les sous-graphes est coloriable avec 
k couleurs, en particulier, cela est vrai pour Go, et donc l'5, qui est un sous-ensemble 
des contraintes exprimant le fait que lo est k-coloriable, est satisfiable. 

Puisque T possède toutes ses parties finies satisfiables, par le théorème de com- 
pacité, l'est donc satisfiable. Cela veut dire que G est k-coloriable, puisque G est 
k-coloriable si et seulement si l’est satisfiable. 


Chapitre [4] 


4.1. On écrit : 
D ARS 


- B:((FS((FSF)>F)) (instance de l’axiome 1.) ; 
- B:(FS(FSF))=(F-=F)) (modus ponens à partir de F; et F2); 
- FM:(F=(F=F)) (instance de l’axiome 1.) ; 
- F:(F=F) (modus ponens à partir de F3 et F1). 
4.2. Une direction est facile : si F1, F2,...,F, est une preuve de F = G à partir de 7’, 


alors F1,F2,...,F,,F, Gest une preuve de G à partir de T U {F'}. Réciproquement, 
on prouve par récurrence sur n que si il existe une preuve de longueur n de G à partir 
de TU {F}, alors il existe une preuve de (F = G) à partir de T. 

Par hypothèse de récurrence, il existe une preuve à partir de T pour chacune des 
formules (F = F),..., (F —= F,), ceci s’appliquant par défaut au cas n = 1. 
Considérons la formule F,, c’est-à-dire G. Trois cas sont possibles : 


1. La formule G est un axiome ou une formule de 7”. On a alors T'+ G. On sait que 
(G = (F = G)) est une instance de l’axiome 1., donconat (G = (F = G)), 
et à fortiori TH (G = (F = G)). Par modus ponens, ona TH (F = G). 


2. Gest la formule F. La correction de l’exercice précédent donne une preuve de 
(F=F). 
3. Il existe i,j < n tels que A; est une formule (H; — G). Par hypothèse de 
récurrence, oaT+(F= H;)eT+H(F = (H; = G)). Alors la suite : 
(CF = (H; = G))=((F = H;) = (F = G))) (instance de l’axiome 2.) ; 
((F = H;) = (F = G)) (modus ponens) 
- (F => G) (modus ponens) 
est une preuve de (F = G) à partir de (F = H;)et (F = (H; = G)). En 
concaténant cette preuve de (F = H;) et de (F = (H; = G)) à partir de T, on 
obtient une preuve de F = G à partir de 7. 


4.3. Pour la première assertion : supposons T'U {F} + G. Par le théorème de la déduc- 
tion (exercice 4.2.),ona TE (F = G). Or la formule ((F = G) = (-G F)) 
est une instance de l’axiome 5, donc par modus ponens, on obtient TH (-G = -F), 
d’où par le théorème de la déduction à nouveau T'U {-G} + -F. 

Supposons maintenant T U {-G} + —F. Par ce qui précède, on obtient T U 
{--F} E --G. Comme --G = Gest une instance de l’axiome 4., par modus 
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ponens on déduit TU {--F}E G.Or(F = --F) est une instance de l’axiome 3. : 
de là, on déduit de toute preuve d’une formule à partir de T U {--F} une preuve à 
partir de la même formule à partir de T U {F'}, et on obtient finalement TU {F}E G. 

Pour la seconde assertion : on a {—F,-G} + -F par définition, d’où par la pre- 
mière assertion, {—F, F} + G, et de là, T + G'si à la fois F et —F sont prouvables à 
partir de T'. 


4.5. Supposons TÜU{F}+H Get TÜ{-F} + G. En appliquant la première assertion de 
l'exercice 4.3. on obtient TU{-G} + -FetTU{-G}+ F. Par la seconde assertion 
de l’exercice 4.3., on obtient que toute formule est prouvable à partir de T U {-G}, 
et en particulier T U {-G} + G!. Par le théorème de la déduction (exercice 4.2.), 
TE (-G = G).I suffit alors d'utiliser l’exercice 4.4. pour déduire TH G!. 


Chapitre 


5.1. Seule la dernière écriture correspond à une formule : dans la première et la seconde 
l’arité de R2 n’est pas respectée. Dans la troisième, la quantification 2 n’est pas sur 
une variable, mais sur un symbole de relation : c’est ce que l’on appelle une formule du 
second ordre, ce qui n’est pas considéré comme une formule valide dans la définition 
précédente (1.e. ce polycopié). 


5.2. Il n’y a pas de variable libre ni d’occurence libre dans la première formule. Dans 
la deuxième formule, la variable x est libre : sa première occurence est liée, sa seconde 
occurence est libre. 


5.4. Pour éviter des notations trop lourdes, on écrira x Ry pour R(x, y), et on s’autorise 
à ne pas écrire toutes les parenthèses. Il suffit de considérer 


(VaxRe) À (VaVy(xRy À yRx = x = y)) À (VaVyV2(xRy À yRz = xR2)). 


5.7. On se contentera ici d’indiquer par une fléche les implications : par exemple, = 
indique que le membre gauche implique le membre droit. 


LL & 
2. & 
3. = 
4 & 
3, + 
6. = 


5.8. Voici des formes prénexes équivalentes 
Va Vy(P(x) À (Q(y) 
VaVyax'(P(x') A 
Vaax'Vy(P(x') A 
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6.6. Clairement la dernière assertion découle de la seconde, puisque le premiere produit 
un modèle qui ne peut pas être le modèle standard des entiers qui satisfait les axiomes 
de Robinson : en effet, dans le modèle standard des entiers (dans les entiers), l’addition 
est commutative. 

Pour la première assertion, il suffit de prouver la propriété par récurrence sur n : elle 
est vraie pour n = 0 par l’axiome Vx 0 + x = x, appliquée en x = s"*(0). Supposons 
la propriété vraie au rang n — 1 > 0 :ona s" (0) + s"(0) = s(s"-1(0)) + s”(0), qui 
selon l’axiome VxVy s(x) + y = s(x + y) appliquée pour x = s"—!(0) et y = s”(0) 
vaut s(s"—1(0)+s7(0)) soit s(s*7"71(0)) par l'hypothèse de récurrence, autrement 
dit srl EN) —_ sm (Q). 

Pour la seconde assertion, il faut par conséquent construire un modèle dont l’en- 
semble de base contient autre chose que (seulement) les éléments s(*)(0) pour n en- 
tier. Voici une façon de procéder : on considère X un ensemble avec au moins deux 
éléments. 

On considère la structure M dont l’ensemble de base est 


M=NU(X x2Z), 


et où les symboles s, +, x, — sont interprétés par les conditions suivantes : 
— = est interprété par l’égalité. s, +, x étendent les fonctions correspondantes sur 
N; 
— pour a = (æ,n): 
- s(a) = (x,n+1); 
—-atm=m+azt(x,n+m); 
- axm=(x,nxm)sim Z0,et(x,n)x0—=0; 
- Mmxa=(z,Mmxn); 
— pour a = (x,n)etb = (y,m): 
— (x,n)+(y,m) = (x,n+m); 
— (x,n)x(y,m) = (x,nxm). 
(dans ces définitons, N, et Z désignent les ensembles (standards) usuels). On vérifie 
que cette structure vérifie bien tous les axiomes de Robinson, et que l’addition n’y est 
pas commutative. 


6.9. On se contentera de donner le schéma de la preuve : on prouve successivement 

— Vu(v+0=v) 

— VoVvo'u + s(v') = s{u + v’) 

— Vu(v +1 = s(v)) où 1 désigne s(0) 

— VaVu'(v + v' = v+v) 

Par exemple, Vu(vu +0 = v) se prouve en observant que 0 + 0 = 0 et que Vu((v + 
O=v) = (s(v) +0 = s(v)). On utilise alors le schéma des axiomes de Peano dans le 
cas où la formule Fest la formule v + 0 = v pour déduire Vu(v + 0 = 0). 


6.12. Considérons un nouveau symbole de constante c. Ajoutons ce symbole de constante 
à la signature des axiomes de Peano. Considérons 7 défini comme l’union des axiomes 
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de Peano et des formules -c = s"(0), pour n un entier. Tout sous-ensemble fini de 7 
admet un modèle, car il est inclus dans l’union des axiomes de Peano et des formules 
—c = 5"*(0) pour 1 < n < N pour un certain entier N : il suffit d’observer que si l’on 
interpréte c par N + 1, alors on obtient un modèle de ce sous-ensemble fini. 

Par le théorème de compacité, 7 admet un modèle. Ce modèle doit satisfaire -c = 
s"*(0) pour tout entier n. L'interprétation de c n’est donc pas un entier standard. Le 
modèle est donc non-standard : il contient des entiers qui ne sont pas standard. 


6.13. Supposons que 7 soit une théorie sur une signature dénombrable qui possède un 
modèle. Elle est donc cohérente : le corollaire[6.2]s’ applique. Observons que la preuve 
du corollaire (en fait la preuve du théorème de complétude) consiste au final à 
construire un modèle M de 7 dont le domaine de base est constitué des termes sur 


la signature. Puisque l’ensemble des termes sur un signature dénombrable est dénom- 
brable, le modèle M construit est dénombrable, et est bien un modèle de 7. 


Chapitre 


7.2. Voici une solution : on considère une machine sur l’ensemble d’états Q — {q0, q1,q2,-:- ,q6} 
avec T = {0,1,B}. 


1/1 + 


0/1 + 
O/B — a 1/1 — (a) 0/0 + 
start —> 1/1 — 
1/B -— 0/0 — BIB + 


BI/B - 
MA Couse 
B/0 - 


0/B — 0/0 + 


La machine est construite pour effectuer le travail suivant : elle recherche le 0 le 
plus à gauche et le remplace par un blanc. Elle cherche alors à droite un 1, quand elle 
en trouve un elle continue à droite jusqu’à trouver un 0 qu’elle remplace par un 1. La 
machine retourne alors à gauche pour trouver le 0 le plus à gauche qu’elle identifie en 
trouvant le premier blanc en se déplaçant à gauche et en se déplaçant depuis ce blanc 
d’une case vers la droite. 

On répète le processus jusqu’à ce que : 
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— soit en cherchant à droite un O0, on rencontre un blanc. Alors les n 0 dans 010” 
ont été changés en 1 et n + 1 des m symboles 0 ont été changés en B. Dans ce 
cas, la machine remplace les n + 1 symboles 1 par un 0 et n blancs, ce qui laisse 
m — n symboles O sur le ruban. Puisque dans ce cas m>n meOn=m-n. 

— ou en recommençant le cycle, la machine n’arrive pas à trouver un 0 à changer 
en blanc, puisque les m premiers 0 ont déjà été changés en B. Alors n > m, 
et donc m© n = 0. La machine remplace alors tous les 1 et 0 restants par des 
blancs, et termine avec un ruban complètement blanc. 


Chapitre 


8.1. À est décidable. 

En effet : Supposons que s vaut 0. Dans ce cas, À est reconnu par la machine de 
Turing qui compare la lettre en face de la tête de lecture à 0 et accepte si elle vaut 0, et 
rejette sinon. 

Supposons que s vaut 1. Dans ce cas, À est reconnu par la machine de Turing qui 
compare la lettre en face de la tête de lecture à 1 et accepte si elle vaut 1, et rejette 
sinon. 

Dans tous les cas, À est donc décidé par une machine de Turing. 


8.2. Il s’agit d’une application directe du Théorème de Rice. 


8.3. Supposons que S C N soit décidable. La fonction x est calculable, car il suffit sur 
l’entrée n de déterminer si n € Set de retourner 1 si c’est le cas, 0 sinon. 

Réciproquement, si x est calculable, S est décidable : sur une entrée n, on calcule 
x et on accepte (respectivement refuse) si x(n) = 1 (resp. x(n) = O0). 

Supposons que S € N soit semi-décidable. La fonction est calculable, car il suf- 
fit sur l’entrée n de simuler la machine qui calcule la fonction, et d’accepter si cette 
simulation termine. 

Réciproquement, si la fonction est calculable, S'est semi-décidable : sur une entrée 
n, on simule le calcul de la fonction et on accepte si la simulation accepte. 


8.4. Soit H la fonction calculable définie par : si { est un programme unaire (une ma- 
chine de Turing) de À, alors H((t),n) donne le résultat de t sur n sinon H((t),n) = 0. 
Par construction Æ est un interpréteur pour tous les programmes unaires de À. La fonc- 
tion À est totale. 
On montre que la fonction calculable totale H'(n) = H(n,n) + 1 n’est pas dans 
À : en effet, sinon il y aurait un { dans À qui calcule H”. On aurait pour tout n, H({t}n) 
qui serait le résultat de t sur n, soit H'(n) = H(n,n) +1. En particulier H((t), (t)) = 
H((t),(t)) + 1. Absurde. 
Ce résultat implique l’indécidabilité du problème de l’arrêt. 
— En effet, supposons que Ar(A,n) décide de l’arrêt de la machine de Turing À 
sur l’entrée n. Pour tout programme unaire f, soit f’ le programme unaire qui 
termine toujours défini par f’(n) = f(n) si Ar(f,n), 0 sinon. 
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— Soit À défini comme l’ensemble des codages des machines de Turing de la forme 
si Ar(f,n) alors f(n) sinon 0. 

— Pour tout programme unaire f qui termine toujours, f’ et f calculent la même 
fonction. 

— Toute fonction unaire calculable totale est représentée par une machine de Turing 
de À. C’est en contradiction avec le résultat précédent. 


8.5. Pour tester si x € E, on énumère les éléments de Æ jusqu’à trouver soit x, auquel 
cas on accepte, soit un élément plus grand, auquel cas on refuse. 


8.6. Pour extraire un ensemble décidable infini d’un ensemble récursivement énumé- 
rable infini, il suffit d’extraire une sous-suite strictement croissante de la suite des 
f(n) : on part avec y = max = 0. Pour n = 0,1,..., 

— On calcule y = f(n). 

— Siy > max alors on fait max := y, et on affiche f(n) 


8.7. Pour n — 0,1,..., on teste si n est dans l’ensemble, et si oui, on l’affiche. 


8.8. Pour tester si x € A, il suffit de tester pour y — 0,1,... si (x,y) € À. Ons’arrête 
dès qu’un trouve un y. 

Tout langage récursivement énumérable est énuméré par une fonction calculable f. 
Il correspond donc à la projection de l’ensemble À — {(n, f(n)|n € N}. Cet ensemble 
À est bien décidable. 


8.11. Leur non-décidabilité découle du théorème de Rice. 

Le premier est récursivement énumérable : on énumère les triples (a, b,t) avec a et 
b deux mots distincts, t un entiers, et pour chacun on teste si À accepte a et b en temps 
t. Si oui, on accepte. 

Le second n’est pas récursivement énumérable car son complément est récursive- 
ment énumérable : on énumère les paires (a,t) et on teste si a est accepté par À en 
temps {. Si oui on accepte. 


Chapitre [9 


9.1. Soit N le modèle standard des entiers. TR(N) correspond à l’ensemble des for- 
mules closes F' vraies sur N. 

Le théorème d’incomplétude dit qu’il existe donc des formules closes vraies de 
Th(N) qui ne sont pas prouvables , ou dont la négation n’est pas prouvable à partir des 
axiomes de Peano, ou de toute axiomatisation “raisonnable” des entiers. 

Soit F une telle formule close. Supposons sans perte de généralité que Fest satis- 
faite sur N. 

Le théorème de complétude dit que les formules closes prouvables sont exactement 
celles qui sont vraies dans tous les modèles. Cela veut donc simplement dire qu’il existe 
d’autres modèles que N des axiomes de Peano : en particulier un modèle ou F' n’est 
pas vérifiée. 
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Dit encore autrement, il y a un modèle des axiomes de Peano avec F vérifiée (par 
exemple N), et un autre modèle où F' n’est pas vérifiée. 

Le théorème de complétude reste bien compatible car F n’est pas vérifiée dans tous 
les modèles. 


9.2. On considère la machine de Turing S qui fait les choses suivantes : 
— sur tout entrée w 
— obtenir par le théorème de récursion sa propre description (S). 
— construire la formule Ÿ = 5. (la formule 7 de la preuve du cours pour la 
machine S 
— énumérer les formules prouvables tant que l’on a pas produit 75e. 
— si l’étape d’avant finit par terminer, alors accepter. 
La formule Y — 75. de la deuxième étape n’est pas prouvable : en effet, d est 
vraie si et seulement si S n’accepte pas le mot vide, car 
— Si S trouve une preuve de 4, alors S accepte le mot vide, et donc la formule 4 
est fausse. 
— (si l’arithmétique est cohérente) on ne peut pas prouver de formule fausse, donc 
ce cas ne peut donc pas se produire. 
Maintenant, observons que si S ne trouve pas une preuve de w, alors S n’accepte 
pas le mot vide : par conséquent Ÿ est vraie sans être prouvable ! ! 
Bref : 4 est vraie mais non-prouvable. 
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10.1. On va utiliser le fait que la limite existe et est positive pour prouver que f(n) — 
O(g(n)) et f(n) = A(g(n)), conformément à la définition de @. 
Puisque 

lim to) =c}>O0, 

nc g(n) 
par la définiton d’une limite, il y a un rang no à partir du quel le rapport est entre 
1 1 : 
zcet 2c. Donc f(n) < 2cg(n) et f(n) > 3cg(n) pour tout n > no ce qui prouve 
exactement ce que l’on souhaite. 


10.3. Le calcul du maximum de n nombres se fait en temps linéaire (voir cours). 

Un algorithme de tri (on prend n nombres en entrée et on doit produire en sor- 
tie ces mêmes nombres dans l’ordre croissant) comme le tri fusion se fait en temps 
O(nlogn) : le tri fusion consiste, pour trier n nombres, à partager en deux sous- 
ensembles de même taille (à 1 près), à trier récursivement chaque sous-ensemble, et 
à fusionner les résultats. La fusion de listes croissantes peut se faire en temps linéaire 
en la somme des tailles des listes. En effet, fusioner dans ce cas consiste à répéter l’opé- 
ration suivante tant que possible : écrire le plus petit élément des deux listes, enlever cet 
élément de sa liste. Cela donne une complexité globale pour le tri fusion qui vérife une 
équation du type T, — O(2 x T,,,2) + On) ce l’on peut prouver donner O(n log n). 

Supposons que l’on se donne n ensembles S1, S2, ..., SA, chacun étant un sous- 
ensemble de {1,2,...,n}, et que l’on veuille déterminer si l’on peut trouver une paire 
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disjointe parmi ces ensembles. Cela se résout en temps cubique : il suffit de parcourir 
les paires S; et S;, et pour chaque paire de parcourir les éléments de S; pour savoir si 
ils sont dans S;. 

Les chapitres suivants contiennent de nombreux exemples de problèmes dont on ne 
connaît pas de solutions polynomiales : les algorithmes présentés ne sont pas polyno- 
miaux. 


10.4. Le temps est respectivement pour (a), 
— multiplié par 4 
— multiplié par 8 
— multiplié par 400 
multiplié par 2 + 1 
elevé au carré 
Et pour (b) : 
— augmenté de 2n + 1 
— augmenté de 3n? + 3n + 1 
augmenté de 200n + 100 
transformé en (n + 1) log(n + 1), soit essentiellement augmenté de O(n log n) 
— multiplié par 2 


| 


Chapitre 


11.4. Si P = NP, alors puisque le complément de P est P (il suffit d’inverser l’état 
d’acceptation et de rejet d’une machine), on doit avoir NP égal à son complément. 
Donc on ne peut pas avoir NP qui n’est pas égal à son complément. 


11.6. Cet exercice est parmi ceux corrigés dans [Kozen, 2006]. 
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12.3. 

— Le problème est dans NP car étant donné un plan de table, on peut vérifier en 
temps polynomial si pour chaque chevalier, il n’est pas à coté d’un ennemi. 

— Nous allons faire la réduction à partir du problème du cycle hamiltonien 
SoitT =< G = (V,E) > une instance du problème du cycle hamiltonien. 
Maintenant, nous allons transformer cette instance en une instance 72 du pro- 
blème des CHEVALIERS DE LA TABLE RONDE de la façon suivante : 
— chaque sommet du graphe est un chevalier. 
— Deux chevaliers sont des ennemis si et seulement si il n’existe pas une arête 

dans G impliquant les deux sommets représentés par ces deux chevaliers 

Cette transformation peut se faire en temps polynomial (nous avons construit le 
complémentaire du graphe G). 
Il est facile de prouver que : 
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— Si il existe un cycle hamiltonien dans G, alors il existe un plan de table. Il 
suffit de voir qu’une arête dans G correspond au fait que les deux chevaliers 
ne sont pas ennemis. Donc le plan de table correspond au cycle hamiltonien. 
— Siil existe un plan de table alors il existe un cycle hamiltonien dans G. 

Donc le problème des CHEVALIERS DE LA TABLE RONDE est plus difficile que 

le problème du cycle hamiltonien. 


Donc le problème des CHEVALIERS DE LA TABLE RONDE est NP-complet. 


12.4. 


— Le problème CHAINE HAMILTONIENNE est dans NP car étant donnée une chaîne, 


on peut vérifier en temps polynomial si elle passe une fois et une seule par chaque 

sommet du graphe et qu’elle a u et v comme extrémité. 

Nous allons faire la réduction à partir du problème CYCLE HAMILTONIEN. Soit 

T=< G=(V,E) > une instance du problème CYCLE HAMILTONIEN. Main- 

tenant, nous allons transformer cette instance en une instance ZT’ du problème 

CHAINE HAMILTONIENNE de la façon suivante : Nous allons construire un 

graphe G’ = (V”,E) tel que 

— Soit u un sommet arbitraire de V 

— V':= VU {v} tel que v est un sommet n’appartenant pas dans V 

- E":= EU {(v, #) : £ est un voisin de w dans G} 

Cette transformation peut se faire en temps polynomial (nous avons juste copier 

le graphe G en rajoutant un sommet et des arêtes). 

Il est facile de prouver que : 

— Si il existe un cycle hamiltonien dans G, alors il existe une chaine hamilton- 
nienne dans G. 
Soit C — (u,l1,...,£{»_1,u) un cycle hamiltonien dans G. Nous construi- 
sons la chaîne P — (u,l1,...,€n-1,v) dans le graphe G”. Cette chaîne est 
hamiltonienne : elle passe une fois et une seule par v et par chaque sommet de 
G puisque Cest un cycle hamiltonien. 

— Si il existe une chaine hamiltonnienne dans G”, alors il existe un cycle hamil- 
tonien dans G. 
Soit P = (u,l1,...,£n-1,v) une chaîne dans un graphe G’. Le cycle C' = 
(u,L1,...,€n-1,u) est hamiltonnien pour le graphe G. 

Donc le problème CYCLE HAMILTONIEN se réduit au problème CHAINE HA- 

MILTONIENNE en temps polynomial. 


Donc le problème CHAINE HAMILTONIENNE est NP-complet. 


12.5. 


— Le problème CHAÎNE est dans NP car étant donnée une chaîne, on peut vérifier 


en temps polynomial si sa taille est de longueur n/2 et qu’elle a uw et v comme 
extrémité. 


— Nous allons faire la réduction à partir du problème CHAINE HAMILTONIENNE. 


SoitT =< G=(V,E),u,v > une instance du problème CHAÎNE HAMILTO- 
NIENNE. 

Nous transformons cette instance en une instance Z’ du problème CHAÎNE de la 
façon suivante. Nous construisons un graphe G’ = (V”, E’) tel que 
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Gest une copie du graphe G plus une chaîne de |V} sommets dont un seul 
sommet de cette chaîne est voisin de u. 

Cette transformation se fait en temps polynomial (nous avons juste copier le 

graphe G en rajoutant un sommet et des arêtes). 

Il est facile de prouver que 
il existe une chaine hamiltonnienne dans G si et seulement si il existe une 
chaine hamiltonnienne dans G’ de longueur M, 

Donc le problème CHAÎNE HAMILTONIENNE se réduit au problème CHAINE ; et 


ce dernier est donc NP-complet. 


12.6. Le problème ARBRE est NP-complet. Il suffit simplement de remarquer qu’une 
chaîne Hamiltonnienne est un arbre couvrant ayant 2 feuilles. 


12.7. 
Point 1. : Soit S'une couverture de sommets du graphe G. Il faut prouver que tous 
les sommets du graphe sont soit voisins de S' ou soit dans S dans le graphe G”. 


1. Comme toutes les arêtes de G ont au moins une de leurs extrémités dans S, tous 
les sommets de G” correspondant à une arête de G sont des voisins de S. 


2. Soit v un sommet de V. Si v n’appartient pas à S, alors v est au moins une extré- 
mité d’une arête (car G est connexe). Comme S est une couverture de sommets 
du graphe G, cela implique que l’autre extrémité de cette arête est dans S. Donc 
v est voisin d’un sommet de S. Par conséquence, tous les sommets de G sont 
soit dans S'ou soit voisins de S. 


Donc S est un ensemble dominant de G”. 

Point 2. : Supposons que $’ € V. S’ domine le graphe G”. Ce qui signifie que 
toutes les arêtes de G ont une de ces extrémités dans S’. Donc S’ est une couverture de 
graphe G. 

Supposons que S” n’est pas un sous-ensemble de V. Il existe un sommet 5 n’appar- 
tenant pas à V dans S”. s est un sommet représentant une arête (u, v) dans le graphe 
G. 

— Si les deux sommets u et v sont dans S”, alors S’\{s} est un ensemble dominant 

de G' de cardinalité plus petite que S”. 
— Siun des deux sommets u et v est dans S”, alors S’\{s}U{u, v} est un ensemble 
dominant de G’ de même cardinalité que S”. 
On réitère le même raisonnement sur cet ensemble jusqu’à supprimer tous les sommets 
n’appartenant pas à V. 

Point 3 : Données : un graphe non-orienté G, et un entier k 

Question : Existe-t-il un ensemble dominant S de G' tel que [S| < k? 


Point 4 : On peut vérifier en temps polynomial si un ensemble de sommets est un 
ensemble dominant et si il est de cardinalité inferieur à k. 
Point 5. Il suffit de combiner les questions précédentes. 


12.8. Point 1. Etant donné un sous-ensemble de sommets de X, on peut vérifier en 
temps polynomiale 
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1. si S'est de cardinalité inferieure à k. 
2. si, pour tout sommet v de V, sa distance à un des sommets de S'est nférieure à b 


Point 2. Nous allons faire la réduction à partir du problème DOMINANT. Soit 7 
une instance du problème du dominant minimum : G = (V, E) et un entier k’. 

Nous construisons l’instance du problème du k-CENTRE : k!' = k et le graphe 
complet À = (V, E') muni de la fonction de poids sur les arêtes suivantes : 


1 si (uv)eE 
wa = À y si mod E 


Cette réduction se réalise en temps polynomiale et elle vérifie les propriétés sui- 
vantes : 
— Siil existe un ensemble dominant de taille inférieure à k dans G alors K admet 
un k-centre de coût 1 ; 
— Si il existe un ensemble dominant de taille supérieure à k dans G alors À admet 
un k-centre de coût 2 ; 
On peut en déduire qu’il existe un ensemble dominant de taille inférieure à dans 
G' si et seulement si X admet un k-centre de coût 1. 


Chapitre 


13.1. On sait que NP C PSPACE. On doit montrer inclusion inverse. On considère 
SAT dans PSPACE, qui est NP-complet. Il est donc NP-dur et donc aussi PSPACE- 
dur. Donc pour tout langage À dans PSPACE, À se réduit à SAT, et puisque SAT € 
NP, on a donc À dans NP. 


14.1 Notes bibliographiques 
Plusieurs corrections (et exercices) sont honteusement plus qu’empruntés à [Arnold and Guessarian, 2005] 


pour les premiers chapitres. D’autres exercices sont inspirés de résultats démontrés 


dans [Cori and Lascar, 1993a] ou dans l’ouvrage [Kleinberg and Tardos, 2005], ou d’exer- 
cices de [Sipser, 1997]. 
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du calcul propositionnel, pour la preuve 
par modus ponens, [52] 
du calcul propositionnel, pour la preuve 
par résolution, 
du calcul propositionnel, pour la preuve 
par tableaux, [60] 
du point fixe,[24][30/[136}138 
premier théorème, 
second théorème, 
premier théorème de Güdel, [85] 
théorie 


cohérente, 

complète, |89| 

sa DT 

de l’arithmétique, 
des ensembles, [23] 

des groupes, [81] 

du calcul des prédicats,[77][78] 
inconsistante, 


thèse de is -Turing,[04][115] 
tiers exclu, [5 


TN 0 ESP 


témoins de Henkin, 


union de deux ensembles, [11] 
notation, voir U 


valeur de vérité, [37|[41] 


valide 
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